2012-04-01 15 views
1

HTML Agilityパックを使用して動的に生成されたHMTLコードを解析する必要があります。このコード例HTMLアジリティパックを使用して動的にHTMLコードを解析する方法は?

:このコードは唯一のいくつかは、コンテキストを検査し、そのようなFirebugのようなツールを点検使って見ることができる。すなわち

<div class="navigation_noClass"> There are 43 articles </div> 

は、Webブラウザのページのソースオプションに表示されていません...

+0

各行の先頭に4つのスペースを使用してコードを書式設定できます – dldnh

答えて

0

今のところ、Agilityパックに直接受け取ったHTMLをフィードしているので、通常のブラウザでは(重要な)いくつかの手順が欠落しているようです。 、すなわちJavascriptおよび/またはCSSの実行。

Javascriptを実行するための多数のオプションがありますが、合理的に「自己完結型」オプションのほとんどは、DOMと関連する機能を再作成する必要があります。自明ではない。

そして、CSSにコンテンツ(Before/After擬似要素など)が含まれていることがあります。私が知る限り、ブラウザ外のHTMLソースにCSSの動作をシミュレートするためのライブラリはたくさんありません。

これは、JavascriptやCSSの実行結果を実際にキャプチャする必要がある場合、ブラウザをアプリケーション処理パイプライン(Chromiumベースのサービスの1つなど)に直接接続するのが最も簡単な場合があります。そのDOMに問い合わせます(多くの機能Webテストスイートと同様の方法で)。

NB:これは重大なサイズのサーバースタイルの処理タスクである場合、そのような処理を専用のサーバー/アプリケーションプール/プロセスに振り分けて、適切なアップタイムやメモリでアプリに戦闘の機会を与えることができます。

関連する問題