2016-10-10 10 views
0

質問はすでに議論されていると思いますが、答えが見つかりませんでした。問題は、ブラウザでページソースを右クリックして選択したときに表示されないページのhtmlコンテンツを取得する方法です。また、クロム開発者ツールでは、要素を右クリックしてinspect要素を選択すると、DOMツリーにその要素が表示されます。例ページ(サイトのリストを取得しようとして)されていますsymfony domCrawlerの解析HTMLがページソースに表示されていません

http://www.liveinternet.ru/rating/

HTMLコンテンツを取得するために私はSymfony2のDomCrawlerを使用して、それはそれは、ページのソース上に存在しない場合を除いて完全にHTMLを取得します。ありがとうございました。

は、そのコンテンツはJavaScriptを使用して動的にロードされているので、これはあなたに

+0

あなたが尋ねていることは非常に不明です。あなたはそれを入力した後、あなた自身の質問を読んだことがありますか? – IronMonkey

+0

ちょうど上記のページのソースを取得しようとします(右クリックして、ビューソースを選択してください)。リンクをクリックして要素を調べると、chrome開発ツールには表示されますが、div id = "rows"の後には空のサイトのリストは表示されません。 – Masha

答えて

2

ありがとうございます。 DomCrawlerは<script>タグを実行しないため、ページを読み込んだ瞬間にDOMにまだ存在していないHTMLはクロールできません。 代わりに、JavaScriptを実行するSeleniumを試してください。

+1

リストはjavascriptで埋められます。リストはページソースの一部としては存在しませんが、リストを生成するjavascriptはそこにあります。 「要素を調べる」ときに見ているのは、ページソースを表示しているときと同じではありません。 – IronMonkey

関連する問題