2011-06-29 8 views
4

いくつかのAjaxベースのウェブサイトをスクレープし、ウェブページの一部をリフレッシュするクリックをシミュレートして、更新されたHTMLを読みたいと思っています。これを行うことができるJavaライブラリがありますか?JavaでAjaxサイトをスクレイプする方法は?

+1

の可能重複[どのように掻き取りAjaxのページを選別しますか?](http://stackoverflow.com/questions/260540/how-do-you-screen-scrape-ajax-pages) – aioobe

+1

私は@Zubairを考えますいずれかの方法では、ApacheのHtmlUnitは行く方法です。一般的なスクリーンスクレーパーではなく、Java側のソリューションを探しています。 –

+0

可能であれば、ヘッドレスサーバーソリューションを使用したいと思いますが、可能でない場合はブラウザや何かを自動化する必要があります – Zubair

答えて

6

HtmlUnitこれは素晴らしいです!それはヘッドレスブラウザであり、クリック、マウスの位置、そしてあなたが望むすべてのもので遊ぶ能力を持っています。

1

これを行う唯一の方法は、JavaScriptが実行され、DOMが更新されたときにデータを取得するようにブラウザを埋め込むことだと思います。 This related stack overflow question may help

関連する問題