A linguagem VB.NET inclui uma classe de análise de HTML que você usa para extrair valores HTML de páginas da web. Use os dados analisados para avaliar o conteúdo em um site e retornar as informações para um usuário ou armazenar as informações extraídas de um banco de dados . A classe de análise de HTML permite que você leia o conteúdo do texto ou quaisquer valores em elementos de formulário como caixas de texto ou suspensa caixas. Instruções
1
Abra o software Visual Studio no "Microsoft NET Framework . " Grupo de programas. Abra seu projeto VB após cargas Visual Studio .
2
botão direito do mouse no nome do projeto no painel " Solution Explorer " e selecione " Propriedades". Clique na guia " . NET " , em seguida, clique duas vezes no arquivo DLL chamado " Microsoft.mshtml . " Esta DLL inclui as classes para analisar HTML.
3
Adicione a biblioteca para o arquivo de código VB que você deseja usar para analisar o HTML. Copie e cole a seguinte declaração VB para o topo do seu arquivo de código :
Importações mshtml
4
instanciar a classe " HTMLDocument " . Esta classe importa o texto HTML que você importou de uma página Web ou string e estabelece as informações para a análise. Adicione o seguinte código para a sua função de análise :
Dim parseHTML Como IHTMLDocument2 = Novo HTMLDocumentClass () Dim HTMLData Como IHTMLElementCollection = parseHTML.body.all
5
Recuperar conteúdo da string HTML . Por exemplo, o código a seguir recupera o valor de uma caixa de texto HTML em uma página da Web:
Dim tbData Como IHTMLInputElement = allElements.item ( " textbox1 " ) Msgbox " Estes são os dados na caixa de texto : "& tbData.Value