Programação  
 
Conhecimento computador >> Programação >> Programação Python >> 
Como Raspe e analisar endereços
Raspagem e análise são duas práticas estreitamente relacionadas de mineração de dados do site. O mais geral , a análise, refere-se a decomposição dos dados nas suas partes constituintes . Quando a sua escola média professora de Inglês lhe pedi para diagramar frases, você estava analisando as palavras de essas frases para suas partes do discurso. Raspagem , mais especificamente, refere-se à análise de páginas web para determinados tipos de dados , neste caso , os endereços . A linguagem de programação Python ea extensão " BeautifulSoup " permitir que o usuário para raspar e analisar sites em poucas linhas de código. Coisas que você precisa
Python 2.6 ou superior
BeautifulSoup 3,2
Show Mais instruções
1

Instale BeautifulSoup baixando a versão mais recente do software porcaria e untar /unzip o arquivo . Abra uma janela do Terminal e digite o seguinte comando: My- iMac: ~ me $ python setup.py Downloads/BeautifulSoup-3.2.0/python instalar

Isto diz o interpretador Python para executar o script de instalação BeautifulSoup que pode ser encontrado na pasta BeautfulSoup , que está na pasta de downloads
2

Tipo Python na linha de comando , pressione Enter e BeautifulSoup importação : . My- iMac: ~ me $ python >>> import BeautifulSoup
3

Execute o seguinte script para abrir uma página web e imprimir quaisquer Universal Resource Locator (endereços web) que você pode encontrar em uma página : >>> urllib2 importação >> ; > page = urllib2.urlopen ( " http://www.THE URL que você deseja para raspar AQUI " ) >>> sopa = BeautifulSoup (página ) >>> soup.findAll ('a ') >>> print soup.strip ( ) >>> printThis script irá abrir uma página web, analisar o html , procure a tag em que os endereços da web são encaixados , remova as tags e deixar o texto.

Anterior :

Próximo : No
  Os artigos relacionados
·Como compilar comandos Python 
·Como calcular números enormes em Python 
·Como testar Python Fluxo manipuladores 
·Como executar um script Python de outro script Python 
·Como carregar um script de Python Interpreter 
·Como limpar uma caixa de listagem em Python 
·Como sincronizar Filas Via XML -RPC em Python 
·Lista Python Substitui 
·Como usar meus scripts Python com Blender 
·Como saber qual a versão do Python que você tem 
  Artigos em destaque
·O que faz vincular média em um computador 
·Como Obter a fonte de um elemento de imagem usando Java…
·Como construir um Plano de Teste de Automação 
·Como usar Lightbox com âncoras suaves 
·Como instalar o CORBA IDL no NetBeans 
·Como criar um serviço Web simples no Apache Tomcat 
·Como recuar texto Usando programação HTML 
·Como usar um InputBox em VBScript 
·Como remover caracteres especiais em ColdFusion 
·Como instalar pacotes LiveWires em Python 
Cop e direita © Conhecimento computador http://ptcomputador.com Todos os Direitos Reservados