2011-12-22 6 views
0

HTTPWebRequestを使用してウェブサイトから特定のテキストを抜き取る方法を教えてください。HTTPWebRequestのページからテキストをスクレイプする方法は?

私はこのコードを持っていますが、HREFでしか動作しません。どのようにしてテキストで動作させることができますか?

私が持っているこすりするHERESにコード:

// setup variables for scraping 
int startPos = 0, endPos = 0, length = 0; 
string tempString = ""; 

// do the scraping 
startPos = html.IndexOf(""); 
endPos = html.IndexOf(">", startPos); 
length = endPos - startPos; 
tempString = html.Substring(startPos, length); 

例えばページは、私はそれだけでこすりthe1ddiariesareback?:

<s class="hash">#</s><b>the1ddiariesareback</b></span></a> 

答えて

4

行うことができますどのようにこのコードを持っていた場合、私はHTML Agility Packにを使用することをお勧めあなたのためにHTMLをダウンロードして解析してください。

XPathまたはLINQ to XML構文を使用して、オブジェクトモデルをクエリできます。

+0

XPath、LINQ、またはXMlを知らないとどうなりますか? – user1017524

+0

@ user1017524 - 1つまたはすべてを学ぶ大きな理由:) – Oded

+0

XPathや他の方が簡単ですか? – user1017524

関連する問題