2012-08-25 24 views
8

ダイナミックWebページからHtmlUnitを使用してデータをクロールしています。これは無限のスクロールを使用して動的にデータをフェッチします。私はスクロールダウンイベントをシミュレートするために、次の文を使用:htmlunitを使用して動的Webページをクロールする

webclient.setJavaScriptEnabled(true); 
webclient.setAjaxController(new NicelyResynchronizingAjaxController()); 
ScriptResult sr=myHtmlPage.executeJavaScript("window.scrollBy(0,600)"); 
webclient.waitForBackgroundJavaScript(10000); 
myHtmlPage=(HtmlPage)sr.getNewPage(); 

をしかし、myHtmlPageが、結果として、私は唯一の最初のクロールすることができ、すなわち、新しいデータがmyHtmlPageに追加されていない以前のものと同じままらしいですウェブページ上のデータはほとんどありません。ご協力いただきありがとうございます!

+0

は、あなたの周りの道を見つけました:私はそれを使用して解決しましたか? –

+0

任意のソリューション?? –

+0

解決策も探しています。結果は? – lummycoder

答えて

0

私は同じことを探していました。私はそれがスクロールイベント(90%確かではない)ではないことが分かりました。 JSにはlinkがあり、ページを読み込むためのresponsilbeであり、多分あなたを助けるかもしれません。

0

ページのスクロール中にコンテンツがポストロードされていたのと同様の問題がありました。

webClient.getCurrentWindow().setInnerHeight(Integer.MAX_VALUE);

+1

は私のためには機能しませんでした –

関連する問題