2011-07-19 10 views
1

ハイパーリンクのテキストやURLを検索し、それは私のテキストは以下の通りあたりにあるとし、ハイパーリンクのURL:、私はすべてのそのテキストを知りたい私はハイパーリンクされているいくつかの単語で大きなテキストを持っている

LoremIpsum.Netが小さいと簡単ですgeneratorを使用せずに適切なサイズの通路を提供する静的なサイトです。このサイトでは、すべての帽子版のテキストだけでなく、翻訳と、この有名なものの説明を提供しています。

これで、そのハイパーリンクされた単語を保存して、配列またはハッシュテーブルにURLを格納したいのですが、これを行うためのサンプルコードを私に提案したり提供したりできます。

ありがとうございます。

+0

*一部の単語がハイパーリンクされているというテキスト*?どのようにそれが行われる、私はテキストがリンク(それはあなたのリンクを見逃したようにリンクをレンダリングするコントロールをリンクしているとは思わない)今すぐリンクをもう一度[3] – V4Vendetta

+0

あなたは、 '' - タグ。 – VMAtm

+0

私はジェネレータのようなすべてのハイパーリンクテキストを見つけたいと思っています。 – Askiitians

答えて

1

参照してください。このページの「正規表現[C#の]を削るプログラム」:http://www.dotnetperls.com/scraping-html

それは基本的にテキストをregexingとマッチを収集することで動作します。

0

は、あなたが適切なHTMLパーサを使用しない場合は、あなたの心を失うことになる

HtmlDocument doc = new HtmlDocument(); 
doc.Load("file.htm"); 
foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href"]) 
{ 
    HtmlAttribute att = link["href"]; 
    // these are your hrefs! 
} 

ようHTMLAgilityPackhttp://www.codeplex.com/htmlagilitypack

何かを試してみてください。

関連する問題