? Uma aranha é um programa que registra as ligações entre páginas da web. As aranhas podem ser escritos em qualquer linguagem de programação, incluindo PHP. Você pode começar um programa de aranha escrito em PHP ou baixando um , ou escrever um. Uma série de bibliotecas de funções de aranha estão disponíveis para PHP. PHP
PHP é uma linguagem de programação escrita para criar páginas Web dinâmicas . Uma página Web dinâmica é aquela cujo conteúdo muda de acordo com as ações do usuário ou ligando parâmetros. Páginas da Web são escritas em Hypertext Markup Language, ou HTML. HTML é um sistema de formatação , no entanto , não é uma linguagem de programação . Páginas da Web são armazenados e entregues em seu estado original. Esta forma de arquivo é chamado de uma página Web estática. Páginas criadas pelo PHP assumir a forma de um modelo de HTML com o código de programação inserido no corpo do documento . Quando o programa é chamado, os blocos de programação são executadas, substituindo -se com HTML.
Aranha
Uma aranha é também chamado de um web crawler ou um Web Bot . O objetivo desta categoria de programa é documentar páginas da Web na World Wide Web . O programa precisa de uma página da Web como um ponto de partida . Isso é chamado de " semente". Segue-se então um link em que página para outra página e , em seguida, segue um link em que página para outra e assim por diante . A aranha pode ser escrita para registrar informações sobre cada página que visita , ou apenas observar a sua existência. Motor de busca aranhas copiar cada página encontrada no banco de dados do mecanismo de busca , onde outros programas de realizar uma análise mais aprofundada . Spiders Embora muitas implementações de aranha tem uma série de tarefas , o ato de passar de uma página para outra é a tarefa que define o programa como uma aranha.
Programação
Embora uma aranha pode ser escrito em qualquer linguagem , Java, Perl e C # são as linguagens mais populares para esses programas . Isto é principalmente porque os programadores especializados em programação Web estão familiarizados com essas línguas. Python e PHP também são usados , mais uma vez , porque essas línguas têm uma habilidade pool seguinte entre a comunidade web.
Método
PHP é geralmente usado para gerar páginas da Web que em seguida, são apresentados ao solicitante browsers. Os navegadores da Web tem o papel ativo de buscar um site e solicitar uma página do servidor web. O papel do PHP é geralmente estática. Um programa PHP operando como uma aranha tem para emular navegadores da Web solicitando páginas da Web de servidores web. Páginas da Web são transportados pelo Protocolo de Transferência de Hipertexto . Isso não faz o download de um arquivo que contém a página , mas cópias fora do código da página e carrega -lo no corpo da mensagem respondendo a um pedido de uma página. A aranha PHP tem de ler no conteúdo da mensagem. Ele não armazena a página, mas lê o texto de entrada para links da Web . O link pode estar em qualquer formato , porque as lojas HTML ligações com uma tag como " " para que o programa só tem que olhar para os símbolos e copiar o texto , onde " .. . "aparece neste exemplo. Pesquisando através de texto e eliminasse seções específicas é chamado de "análise" Em linguagem de programação .