Software  
 
Rede de conhecimento computador >> Software >> Software de Animação >> Content
O que é um programa de computador de aranha?
Um programa de computador "Spider", mais conhecido como um rastreador web ou aranha da web , é um tipo de bot que navega sistematicamente na World Wide Web, normalmente com o objetivo de indexar páginas da Web para um mecanismo de pesquisa. Faz isso seguindo links de página para página.

Aqui está um colapso de como funciona:

* começa em um URL de semente: O rastreador começa com uma lista de URLs iniciais (os URLs "sementes"). Estes podem ser fornecidos manualmente ou escolhidos a partir de um banco de dados de sites conhecidos.

* busca o html: O rastreador baixa o código -fonte HTML de cada URL que ele visita.

* analisa o html: Ele analisa o HTML para extrair informações, como:
* Conteúdo do texto: As palavras e frases na página.
* Links : URLs apontando para outras páginas da web.
* Metadados : Informações como título, descrições e palavras -chave.

* indexa as informações: Os dados extraídos são armazenados em um índice, um banco de dados massivo usado pelos mecanismos de pesquisa para recuperar rapidamente resultados relevantes para as consultas do usuário.

* segue os links: O rastreador acrescenta os links recém -descobertos à sua fila de URLs para visitar. Ele prioriza alguns links sobre outros com base em vários fatores (como a autoridade da página de ligação). Esse processo continua recursivamente, expandindo -se para fora dos URLs iniciais de sementes.

* respeitando robots.txt: Os rastreadores da Web éticos e bem-comportados respeitam o arquivo `robots.txt` em cada site. Este arquivo especifica em quais partes do site o rastreador é permitido ou não permitido para acessar.

* políticas de polidez: Para evitar sites de sobrecarga, bons rastreadores implementam políticas de polidez, que envolvem limitar a taxa na qual solicitam páginas de um único servidor e potencialmente adiando suas solicitações.


Em suma, uma aranha é um programa automatizado que explora sistematicamente a Web, coletando informações e tornando -a pesquisável. É um componente crucial de como os mecanismos de pesquisa funcionam.

Anterior :

Próximo :
  Os artigos relacionados
·Como fazer um giro Texto 3D em Flash CS5 
·Tutorial para projetar luz do dia com o 3ds Max Design 
·Como Desbloquear o Sims Deluxe Edition Usando o número…
·Como fazer sites com Flash CS5 
·Quais são alguns exemplos de software de animação 2D…
·Construa uma Casa Jogo de Simulação Virtual 
·Quais são as três tarefas que podem ser executadas no…
·Como fazer uma animação SWF 
·Como converter um MP4 para SCR 
·Como ativar o Adobe Flash Player 
  Artigos em destaque
·Como colocar slides em um DVD 
·Como criar nome intervalos no Excel 2007 
·Microsoft SQL Server Procedimentos para enviar e-mails …
·Como usar o Adobe Reader 
·Qual formato de áudio pode funcionar no Windows Mac OS…
·Como fazer backup automático XP 
·Como usar o QuickBooks para criar Orçamentos 
·Como converter Courier e-mail para Thunderbird 
·Como formatar Nota Páginas em Apresentador Ver PowerPo…
·Como formatar cartões 3x5 
Cop e direita © Rede de conhecimento computador https://ptcomputador.com Todos os Direitos Reservados