2011-10-26 4 views
4

ウェブサイトのAJAX/Javascriptによって制御される情報を取得するために、Rスクリプトを使用してブラウザ(Firefoxが好ましい)を制御する方法を見つけようとします。たとえば、フィールド "Modell"の値をhttp://www.mobile.de/home/index.htmlに取得するにはどうすればよいですか?AJAX/Javascriptsを処理するためにRからFirefoxを制御する方法

AFAIU、Gabe Beckerのパッケージ"RFirefox"は、FirefoxとFirefoxの間に何らかの種類のリンクを提供しています。しかし、Windows-Kid(信念ではなく、長年のネットワーク効果;-))であるため、私は自分自身でそれを試すことができませんでした。

So:RFirefoxやAJAX経由でRを扱っている人はいますか?宿題をしたくないのですが、Linuxの世界に突入する前に、それが価値があるかどうか評価したいと思います。

しかし、どのコード例も非常に高く評価されます。 ;-)

+0

ない正確に何が必要が、同様: http://stackoverflow.com/questions/7867105/parsing-html-and-following-a-javascript-link/7905861#7905861 –

+0

クール、感謝のためにポインタ! – Rappster

答えて

3

これを行うにはブラウザが必要な理由がわかりません。それはちょうどウェブを掻くことです。ある種のパーサが必要ですが、必ずしもブラウザである必要はありません。私はRFirefoxが間違ったツリーを吠えているかもしれないと思います。 Javascript + Rの接続で遊びたい場合は、Duncan Temple LangのSpiderMonkeyをご覧ください。

でも、私は、Javascriptで作業するのに適したより深刻なクロール/スクレイピング機能を使ってデータを収集するほうが良いかもしれないと思います。 This question on SOはそれと特によく似ているようです。私がお勧めするのは、必要なものを実行するツールを手に入れ、できるだけ簡単なレベルでRとインターフェースすることです。 Webkitはいくつかの言語にバインドされていますが、Rの場合はそうではありません。

This questionあなたの状況はさらにあなたの状況に対応しています。 Webkitは使用しません。受け入れられた答えの3つの提案は、PythonからC/C++で書かれたツールにアクセスすることです。 Rには両方のインタフェースがありますので、これらを使用して作業するための物を書き、RとPythonまたはC/C++間でオブジェクトと命令を前後に渡す方が簡単です。

+0

アドバイスをありがとう!私はそれらをより詳細にチェックして、私にとって最良の方法が何かを理解するでしょう。 – Rappster

+0

さて、あなたのリンクを通してスキャンしました:1)長期的に見て最も簡単な方法は、実際のユーザーを "シミュレート"するだけで、ブラウザを遠隔操作するという私の考えです。 2)SpiderMonkey:ポインタがありがとう! 3)その点でRubyについてどう思いますか?試しに値するか、私はこの仕事のためにPythonに突っ込んでいくのが好都合です。 – Rappster

+0

私はRubyに慣れていないので、私の好みはPythonですが、それは個人的な決定です。質問はPythonでいくらか解決され、Pythonコミュニティには多くのR sympathizerがあります(逆も同様です)。これはガイドになるかもしれませんが、それはあなた次第です。 – Iterator

関連する問題