? Programadores virar para a linguagem de programação Python para construir seus projetos , em parte por causa de sua extensa biblioteca de funções e módulos embutidos. Um dos desses módulos , urllib , dá aos programadores uma estrutura para conectar e recuperar informações de recursos da Internet. Desta forma , os programadores podem fazer pedidos a partir de sites , coletar informações , como páginas da Web e armazenar essas informações no disco rígido local. Recuperando Objetos de Rede
urllib abre objetos de arquivo a partir da Web , acessando -os através da sua URL. A função urlopen vai ter um objeto de rede a partir de um recurso de rede , geralmente na forma de uma página da Web, e armazená-lo como um objeto de arquivo Python. Este objeto pode ser manipulado em muito da mesma maneira como um objeto de arquivo Python, através de funções, como ler ou readline .
Copiando Objetos de Rede
urllib também pode recolher objetos, como páginas da Web a partir da Internet e armazená-los no disco rígido local. Isso permite que o programa Python para acessar o arquivo a partir do disco rígido local , em vez de sempre solicitando a página toda vez que o objeto é necessária. A função urlretrieve recebe um objeto de rede e retorna uma tupla, ou coleção de valores , o que representa o nome do arquivo salvo e quaisquer cabeçalhos especiais no arquivo .
Codificação URLs
urllib também pode tomar uma série de tuplas de dois de entrada e convertê-los em URLs . A função urlencode converte uma série de tuplas em pares chave-valor que se tornam parte de uma URL quando o pedido de URL envia informações . Isso permite que o programa para solicitar informações dos usuários, armazená-lo com um valor de chave que define as informações necessárias do servidor e construir um URL para enviar um pedido de URL.
Handle Códigos especiais de resposta HTTP < br >
ao fazer pedidos de objetos a partir de uma rede , solicita especificamente http (como quando é feita uma solicitação para uma página da Web ) , o servidor pode retornar certos códigos de resposta . Esses códigos significam algo sobre o estado da página, tais como a sua de ter sido movido. Outros códigos representam o fato de que a página não foi modificado desde a sua última visita e não precisa ser atualizado . A função FancyURLopener lida com solicitações onde esses códigos podem ser devolvidos e oferece padrão manipulação para a sua ocorrência .