2011-01-25 11 views
-1

APIをクロールしてxmlまたはcsvファイルに解析するWebcrawlerを探しています。APIリクエストをクロールしてXMLをCSVに解析できるオープンソースのWebクローラを探します

私はいくつかのAPIフィードからのリクエストで遊んでいましたが、手動でやりとりしなければならないとうれしく思います。後で自動的に編集してデータを編集する必要があります。

たとえば、eventfulというサイトのAPIを使用して、「?xmlフィード?」をリクエストできます。データ

http://api.eventful.com/rest/events/search?app_key=LksBnC8MgTjD4Wc5&location=pittsburgh&date=Future

のリンクを調べる場合は、返送されたXMLデータのトンがある見ることができます。

私は、XMLデータがすでに要素によって分解されているので、分類を処理するようにクローラに要求するのは難しくないと考えました(たとえば、city要素はすべてのデータをcsvドキュメントのcityフィールドに送ります)誰もがAPIをクロールし、フォーマットなどのデータをExcelに解析されている関連する既存のオープンソースのWebクローラを使用している場合

私は思ったんだけど....

私はNutchのに見えたが、私は内の任意の参照を見つけるcouldntのXMLフィードをAPIフィードによって返された要素に基づいてExcel形式のドキュメントにソートするためのドキュメント。

これまで誰もこのようなことをしておらず、あなたはプログラムを参照できますか?具体的には本当に役に立ちます。

答えて

0

私はhttp://import.io/で私たちは、あなたが使用してAPIを構築、mozendaに似た無料のソリューションを持っている私が何かオープンソース

1

を見つけることができる場合、私は更新します

..... Mozendaと呼ばれる有料の解決策を見つけましたGoogleのウェブブラウザを使用して、APIをGoogleのサーバーにアップロードして無料で使用できます。また、クローラやその他のさまざまな機能も提供しています。それを確認して、あなたの考えを見てください:)

P.S私はimport.ioのために働いています。

+0

import.ioはうまく機能しませんでした。それはまだ最高でも粗いアルファです。私が望むのは、特定のウェブサイトドメインの下にあるURLのリストです。 – Ron

+0

こんにちはRonさん、私たちのサポートチーム([email protected])があなたを手伝ってくれることを嬉しく思っています。私たちのために要求し、私たちは確かにそれに対応しています。 – Bam4d

関連する問題