私はクローラの基本構造を設定しました。今、私はいくつかのPHP駆動ウェブサイトでそれをリリースし、それは魅力のように動作します。現在、私はAjaxのコンテンツからデータシートを作成したいと思っています。Pythonクローラー。
現時点では私はMechanize for PYTHONとperlを使用してクローラを構築しています。 MechanizeモジュールはAJAXを実行しません。非同期のajaxによって構築されたコンテンツにはどうすれば到達できますか?
私には、自動化するための実際のブラウザであるSeleniumというものがあります。しかし、これは私の唯一の選択肢ですか?
私には、なぜ実際のjavascriptを)、それをいくつかのエグゼキュータまたはハンドラに送ります。それはすべての要求を行い、私に出力を返しますか?それとも、私はスパイダーモンキーを使うべきですか?お返事ありがとう –
spidermonkeyモジュールは、PythonでJavascriptクラス、オブジェクト、関数の実装、Javascriptスクリプトと関数の '評価'と呼び出しを可能にします。 – RanRag
こちらをご覧くださいhttp://meta.stackexchange.com/questions/5234/how-does-accepting-an-answer-work – RanRag