O " jsoup " biblioteca Java contém uma função que retira uma string Java de todas as tags HTML e converte o conteúdo em texto simples. Esta biblioteca é útil quando você deseja fazer o download de sites e site HTML e avaliar apenas o texto em seu programa. O conteúdo é a esquerda, para que você pode salvar o conteúdo em um banco de dados ou armazenar o conteúdo em um arquivo no servidor local. Instruções
1
direito do mouse no arquivo Java que você deseja editar e selecione " Abrir com". Clique com o editor applet Java na lista de programas para abrir o código.
< Br > 2
Localize a string HTML que você deseja analisar e criar a variável de texto simples. O código a seguir cria uma variável para armazenar o conteúdo HTML analisada :
Documento de texto simples = null;
3
analisar o HTML para texto simples e armazenar o resultado ao " , variável de texto simples " . O código a seguir mostra como analisar as tags HTML :
PlainText = Jsoup.parse (html );
Substitua o " html " com seu próprio string HTML
.