2011-08-17 4 views
0

私はPython Mechanizeを使用してデータをスクラップする方法を学んでいます。ほとんどの場合、動作していますが、私が実行した問題の1つは、「submit」ボタンを使用する代わりに、私がアップデートを見ている.jspページが動的に更新されていることです。python mechanizeを使って動的に更新する.jspフォームを解析する方法は?

1)私は、ページ上で設定する必要があり、複数のSelectControlsがあります

私は2つの関連する結果として問題に実行していますよ。私は最初のSelectControlを設定するまで、2番目のSelectControlの項目は設定されません。最初のSelectControlを目的の値に設定してページをリフレッシュするには(最初のドロップダウンからオプションを選択すると自動的に実行される '実際の'ブラウザウィンドウで)私はブラウザオブジェクトのresponse()メソッドとreload()メソッドを使ってみましたが、これらは最初のSelectControlに割り当てた値を消去します。

2)SelectControlコントロールの値を設定すると、スクラップしたいデータが動的に表示されます。再度、これらの値を反映するためにブラウザを更新する必要がありますが、送信ボタンはありません。

答えて

0

Mechanizeはjavascriptを処理しません。javascriptの機能を複製することができます(たとえば、可能な値を見つけて手動で構築/選択するなど)。詳細および代替ソリューションについては、この回答を参照してください。How to properly use mechanize to scrape AJAX sites

関連する問題