O que é um programa de computador de aranha?

Software

* Rede de conhecimento computador >> Software >> Software de Animação >> Content

Um programa de computador "Spider", mais conhecido como um rastreador web ou aranha da web , é um tipo de bot que navega sistematicamente na World Wide Web, normalmente com o objetivo de indexar páginas da Web para um mecanismo de pesquisa. Faz isso seguindo links de página para página.

Aqui está um colapso de como funciona:

* começa em um URL de semente: O rastreador começa com uma lista de URLs iniciais (os URLs "sementes"). Estes podem ser fornecidos manualmente ou escolhidos a partir de um banco de dados de sites conhecidos.

* busca o html: O rastreador baixa o código -fonte HTML de cada URL que ele visita.

* analisa o html: Ele analisa o HTML para extrair informações, como:
* Conteúdo do texto: As palavras e frases na página.
* Links : URLs apontando para outras páginas da web.
* Metadados : Informações como título, descrições e palavras -chave.

* indexa as informações: Os dados extraídos são armazenados em um índice, um banco de dados massivo usado pelos mecanismos de pesquisa para recuperar rapidamente resultados relevantes para as consultas do usuário.

* segue os links: O rastreador acrescenta os links recém -descobertos à sua fila de URLs para visitar. Ele prioriza alguns links sobre outros com base em vários fatores (como a autoridade da página de ligação). Esse processo continua recursivamente, expandindo -se para fora dos URLs iniciais de sementes.

* respeitando robots.txt: Os rastreadores da Web éticos e bem-comportados respeitam o arquivo `robots.txt` em cada site. Este arquivo especifica em quais partes do site o rastreador é permitido ou não permitido para acessar.

* políticas de polidez: Para evitar sites de sobrecarga, bons rastreadores implementam políticas de polidez, que envolvem limitar a taxa na qual solicitam páginas de um único servidor e potencialmente adiando suas solicitações.

Em suma, uma aranha é um programa automatizado que explora sistematicamente a Web, coletando informações e tornando -a pesquisável. É um componente crucial de como os mecanismos de pesquisa funcionam.

Anterior : Que kaind do computador que os estúdios da Pixar Animation usam para fazer filmes?

Próximo : Como você toca sua animação no Adobe Flash CS4?

Os artigos relacionados

·	Como fazer um giro Texto 3D em Flash CS5
·	Tutorial para projetar luz do dia com o 3ds Max Design
·	Como Desbloquear o Sims Deluxe Edition Usando o número…
·	Como fazer sites com Flash CS5
·	Quais são alguns exemplos de software de animação 2D…
·	Construa uma Casa Jogo de Simulação Virtual
·	Quais são as três tarefas que podem ser executadas no…
·	Como fazer uma animação SWF
·	Como converter um MP4 para SCR
·	Como ativar o Adobe Flash Player

Artigos em destaque

·	Como colocar slides em um DVD
·	Como criar nome intervalos no Excel 2007
·	Microsoft SQL Server Procedimentos para enviar e-mails …
·	Como usar o Adobe Reader
·	Qual formato de áudio pode funcionar no Windows Mac OS…
·	Como fazer backup automático XP
·	Como usar o QuickBooks para criar Orçamentos
·	Como converter Courier e-mail para Thunderbird
·	Como formatar Nota Páginas em Apresentador Ver PowerPo…
·	Como formatar cartões 3x5