arquivos Reading HTML em Java não é diferente do que a leitura de arquivos de texto . A menos que o formato do arquivo é XML, lendo um arquivo HTML é realizado com um objeto de arquivo Java. O objeto importa o texto do arquivo e lê -lo linha por linha. Você pode então usar o texto para manipulação, ou você pode produzir o texto na tela . Usando o objeto de arquivo em Java para ler os arquivos é feito com algumas linhas de código. Instruções
1
Importe as bibliotecas necessárias . Usando o objeto de arquivo requer o uso de bibliotecas Java que não são importados automaticamente quando você cria uma nova classe ou projeto. O código a seguir mostra as bibliotecas necessárias : java.io.BufferedInputStream importação ; java.io.DataInputStream importação ; import java.io.File ; java.io.FileInputStream importação ; java.io.FileNotFoundException importação ; import java.io.IOException ;
2
Abra o arquivo e configurar buffers. O objeto de arquivo precisa da localização do arquivo HTML no computador. Isso também pode ser um arquivo no servidor web. O código a seguir define uma variável para abrir o arquivo e cria variáveis a utilizar para a myhtml = new File filestream.File ("C: \\ \\ myHTML.html "); FileInputStream FileInput = null; BufferedInputStream mybuffer = null; DataInputStream DataInput = null;
3
Atribuir as informações do arquivo para as variáveis criadas . As variáveis de buffer carregar as informações na memória para mais rápida leitura times.fileinput = new FileInputStream ( myhtml ); mybuffer = new BufferedInputStream ( FileInput ); DataInput = new DataInputStream ( mybuffer );
4
Crie um loop que lê a linha por linha do arquivo e imprime -lo para o console. O código a seguir lê os dados , desde que ele não tenha chegado ao fim do fluxo de arquivo : while ( datainput.available () = 0 !) {System.out.println ( datainput.readLine ()); }
5
Feche o fluxo de arquivo . Para liberar memória da aplicação , é importante para fechar os fluxos de arquivo e dados : myHTML.close (); mybuffer.close (); datainput.close ();