A página da Web que você vê no seu browser não mostra tudo na página . Nos bastidores, o navegador carrega constantemente o conteúdo que contém o código HTML enigmática. Este código é composto por "tags" , como "
". Essa tag diz ao navegador para exibir um parágrafo na página Web . Usando C #, linguagem de desenvolvimento da Microsoft que trabalha com o Visual Studio, você pode converter qualquer site HTML ao texto e remover as tags. Instruções
1
Abra o Microsoft Visual Studio. Clique em "Arquivo " e clique em "New Project ".
2
Clique em " Visual C #" para realçá-lo e dê um duplo clique em " Windows Forms Application ". O Visual Studio irá criar um novo projeto e exibir um formulário vazio na janela de designer.
3
Clique em "Exibir ", e , em seguida, clique em " Ferramentas " para abrir a caixa de ferramentas. Desloque-se para o controle WebBrowser, e clique duas vezes nele . Esse controle irá aparecer no formulário. Nomes do Visual Studio que " WebBrowser1 ".
4
Pressione " F4 ". A janela "Propriedades" abre . Localize o ícone do " Lightning Bolt " no topo da janela. O ícone tem a forma de um raio. Clique no ícone . A janela "Propriedades" irá exibir uma lista de eventos que você pode anexar ao controle " webBrowser1 " .
5
Localize o item " DocumentCompleted " na lista e clique duas vezes nele . A janela de código é aberto e exibe o seguinte código: private void
webBrowser1_DocumentCompleted (object sender, WebBrowserDocumentCompletedEventArgs e)
{
}
Este código é executado sempre que o controle " webBrowser1 " termina de carregar uma página da Web
6
modificar esse código para que ele se parece com isso : .
private void webBrowser1_DocumentCompleted (object sender, WebBrowserDocumentCompletedEventArgs e)
{
HtmlDocument doc = webBrowser1.Document ;
corda websiteText = doc.Body.InnerText ;
MessageBox.Show ( websiteText );
}
Depois que uma página da Web é carregada , este código pega o texto da página . Em seguida, exibe o texto em uma caixa de mensagem pop-up.
7
o botão direito do mouse em qualquer lugar na janela de código e, em seguida, clique em " View Designer. " O formulário irá reaparecer na janela de designer.
8
Clique duas vezes em barra de título dessa forma . Outra janela de código irá aparecer e mostrar método de " Load" do formulário. O código em que o método é executado quando o formulário é carregado . O código aparece como mostrado abaixo :
Form1_Load private void (object sender, EventArgs e) {
}
9
Substitua esse código com o seguinte código :
Form1_Load private void (object sender, EventArgs e) {
website string = " http://www.whitehouse.gov ";
WebBrowser1.Navigate (website) ; " . site "
}
Este código faz com que o controle " webBrowser1 " para navegar até o URL do site armazenado na variável chamada Neste exemplo, a URL é " http://www.whitehouse.gov ".
10
Pressione " F5 " para executar o código. O formulário irá carregar e executar o código " Form1_Load " . Esse código faz com que o controle " webBrowser1 " para navegar até o site " whitehouse.gov " . O código " DocumentCompleted " será executado depois que o navegador termina de carregar o site. Uma caixa de mensagem pop -up irá mostrar-lhe o texto a partir desse site , sem as tags HTML .