私はHTMLタグとヘッダーなしでウェブサイトのテキストを読んでみたいです。私はちょうどウェブブラウザに表示されるテキストが必要です。C#でウェブサイトのコンテンツを読むには?
私は単なるテキスト "かくかくしかじかBLA" を必要とし、この
<html>
<body>
bla bla </td><td>
bla bla
<body>
<html>
のような必要はありません。
私は、HTMLコンテンツを取得するために、受信したデータを分割するのWebClientとHttpWebRequestの方法を使用していたが、私は、ウェブサイトを変更した場合、タグが変更される可能性があるため、それは不可能です。
ウェブサイトに表示されているテキストのみをアナグマティックに取得する方法はありますか?
などのjavascript機能など、あなたがはっきりしたくないデータを持つノードなどを返します。取得したい要素です。したがって、パーサのgetElementByIdのようなメソッドで取得します。 – alfoks
@alfoks ::あなたはHTMLパーサーの例のリンクを持っていますか? –