できるだけ一般的な方法でHTMLページを解析したいと思います。ページが変更されるたびにパーサを構築したくないので、タグの値をスマートに解析したいと思います。C#でAgility Packを使用してページ内のすべてのHTMLタグを反復処理する方法は?
タグの種類(td、strong、liなど)で読み込んで検索するツールがHTMLアジリティパックに用意されていますが、すべてのタグを繰り返して、のコンテンツタイプが変更できるので、タグのタイプではなくタグのになります。
例: ページ:と 性別が含まれています次のタグ:
<table>
<tr valign="top">
<td valign="top">Sex:<br />
</td><td valign="top">Male<br />
</td></tr>
<tr valign="top">
<td valign="top">Current City:<br />
</td><td valign="top">New York<br /></td>
- 私は値が「セックス」になることを知っています。
- 私は値が "現在の都市"であり、次の タグが都市になることを知っています。
私はタグで反復することができますが、タグが変更された場合、パーサはもはや機能しなくなります。
タグの種類ではなく値で反復処理できますか?