2017-09-20 8 views
-1

現在、Webページからjavascriptで生成されたコンテンツをスクラップするためにPhantomJSでセレンを使用しています。これで私が探している結果が得られますが、スクレイピングする前にページが読み込まれるのを待つ必要があるため、遅いアプローチです。私が探しているコンテンツを生成するjavascriptを直接実行する方法はありますか?もしあれば、私は現在使っているよりも速いアプローチでしょうか?javascriptで生成されたコンテンツをWebページから直接取得する方法はありますか?

ありがとうございます!

+1

「スクラップする前にページが読み込まれるまで待つ必要があります」セマンティクスは可能ですが、ページを取得する前にページをスクラップする方法はありますか? – Vaviloff

+0

コンテンツはjavascriptによって実際に生成されますか?または、外部ソースからjavascriptによって取得されますか? – Peteris

+0

ページが一般的にゆっくり読み込まれるということですか?はいの場合は、この質問と回答をご覧ください:https://stackoverflow.com/a/42710420/2715393 – Vaviloff

答えて

0

残念ながら、ありません。私はこの問題に何度か遭遇しました。私が思いついた唯一の解決策は、あなたがすでにやっているように問題に近づけることです。 コンテンツがjs-generatedであるため、ブラウザから取得する方法は唯一取得する方法ですので、好きなドライバでセレンを使用してください。

関連する問題