いくつかのAjaxベースのウェブサイトをスクレープし、ウェブページの一部をリフレッシュするクリックをシミュレートして、更新されたHTMLを読みたいと思っています。これを行うことができるJavaライブラリがありますか?JavaでAjaxサイトをスクレイプする方法は?
4
A
答えて
6
HtmlUnitこれは素晴らしいです!それはヘッドレスブラウザであり、クリック、マウスの位置、そしてあなたが望むすべてのもので遊ぶ能力を持っています。
1
これを行う唯一の方法は、JavaScriptが実行され、DOMが更新されたときにデータを取得するようにブラウザを埋め込むことだと思います。 This related stack overflow question may help。
0
(初回のみ1がJava開発者に意図されたが)これらの本はあなたを助ける必要があります。
関連する問題
- 1. pythonでサイトをスクレイプするためにクッキーを作成する
- 2. コメントタグ内のテーブルをRでHTMLでスクレイプする方法は?
- 3. scraped_resource gemでスクレイプを設定する方法は?
- 4. Scrapy 1.4.0でjavascriptからデータをスクレイプする方法は?
- 5. Javaでサイトにログインする方法
- 6. Javaでサイトにログインする方法
- 7. jQuery UI.LayoutプラグインをAJAXサイトに統合する方法は?
- 8. リクエストペイロードを使用してWebスクレイプする方法は?
- 9. HTTPWebRequestのページからテキストをスクレイプする方法は?
- 10. AJAXサイトのリソースページへのダイレクトナビゲーションでログインを確認する方法
- 11. AjaxリクエストでサーバーからWebサイトをリダイレクトする方法
- 12. Seleniumを使ってajaxベースのサイトを記録する方法
- 13. AJAXがサイトをリフレッシュするのを防ぐ方法
- 14. スクレイプ、
- 15. スクレイプ
- 16. 外部サイトからAJAX経由でサーバーにデータを送信する方法は?
- 17. Ajax駆動のWebサイトでソフト404を修正する方法は?
- 18. ブラウザでGoogleのURLをスクレイプする最も簡単な方法は?
- 19. AJAX/JS重生産サイトにコードをプッシュする方法
- 20. トレントのスクレイプURLを計算する方法
- 21. asp.netサイトでjavaパッケージを使用する方法
- 22. "inspect element"領域内のコードをスクレイプする方法はありますか?
- 23. Ajax/javaスクリプトでWebページにシステムログを出力する方法
- 24. スクレイプ::スクレーパー
- 25. スクレイプWP7
- 26. Java Seleniumを使用してリモートWebサイトをキャプチャする方法
- 27. ウェブデータをスクレイプするために、スクレイプまたはセレンまたは機械化できますか?
- 28. AJAXサイトをスクラップするためにmechanizeをうまく使用する方法
- 29. Joomla!でAjaxを使用する方法Iフレームのドロップダウンではなく、MplayerドロップダウンP3用のサイトですか?
- 30. Sharepoint 2007サイトをミラーリングする方法は?
の可能重複[どのように掻き取りAjaxのページを選別しますか?](http://stackoverflow.com/questions/260540/how-do-you-screen-scrape-ajax-pages) – aioobe
私は@Zubairを考えますいずれかの方法では、ApacheのHtmlUnitは行く方法です。一般的なスクリーンスクレーパーではなく、Java側のソリューションを探しています。 –
可能であれば、ヘッドレスサーバーソリューションを使用したいと思いますが、可能でない場合はブラウザや何かを自動化する必要があります – Zubair