2012-03-16 15 views
0

できるだけ一般的な方法でHTMLページを解析したいと思います。ページが変更されるたびにパーサを構築したくないので、タグの値をスマートに解析したいと思います。C#でAgility Packを使用してページ内のすべてのHTMLタグを反復処理する方法は?

タグの種類(td、strong、liなど)で読み込んで検索するツールがHTMLアジリティパックに用意されていますが、すべてのタグを繰り返して、のコンテンツタイプが変更できるので、タグのタイプではなくタグのになります。

例: ページ:と 性別が含まれています次のタグ:

<table> 
<tr valign="top"> 
<td valign="top">Sex:<br /> 
</td><td valign="top">Male<br /> 
</td></tr> 
<tr valign="top"> 
<td valign="top">Current City:<br /> 
</td><td valign="top">New York<br /></td> 
  • 私は値が「セックス」になることを知っています。
  • 私は値が "現在の都市"であり、次の タグが都市になることを知っています。

私はタグで反復することができますが、タグが変更された場合、パーサはもはや機能しなくなります。

タグの種類ではなく値で反復処理できますか?

答えて

0

<table>内のすべてのノードをHtmlNodeCollectionに入力できます。次に、ノードのそのリストを反復処理:その内

foreach (HtmlNode node in ListofNodes)

は、あなたがあなたの特定の文字列をチェックするために、各ノードのInnerHtmlを確認するだろうか?私はテーブルが毎回同じフィールドを持っていると思います。どちらか、またはidの/ cssクラスを追加し、その特定のid/cssクラスを探します。

関連する問題