APIをクロールしてxmlまたはcsvファイルに解析するWebcrawlerを探しています。APIリクエストをクロールしてXMLをCSVに解析できるオープンソースのWebクローラを探します
私はいくつかのAPIフィードからのリクエストで遊んでいましたが、手動でやりとりしなければならないとうれしく思います。後で自動的に編集してデータを編集する必要があります。
たとえば、eventfulというサイトのAPIを使用して、「?xmlフィード?」をリクエストできます。データ
http://api.eventful.com/rest/events/search?app_key=LksBnC8MgTjD4Wc5&location=pittsburgh&date=Future
のリンクを調べる場合は、返送されたXMLデータのトンがある見ることができます。
私は、XMLデータがすでに要素によって分解されているので、分類を処理するようにクローラに要求するのは難しくないと考えました(たとえば、city要素はすべてのデータをcsvドキュメントのcityフィールドに送ります)誰もがAPIをクロールし、フォーマットなどのデータをExcelに解析されている関連する既存のオープンソースのWebクローラを使用している場合
私は思ったんだけど....
私はNutchのに見えたが、私は内の任意の参照を見つけるcouldntのXMLフィードをAPIフィードによって返された要素に基づいてExcel形式のドキュメントにソートするためのドキュメント。
これまで誰もこのようなことをしておらず、あなたはプログラムを参照できますか?具体的には本当に役に立ちます。
import.ioはうまく機能しませんでした。それはまだ最高でも粗いアルファです。私が望むのは、特定のウェブサイトドメインの下にあるURLのリストです。 – Ron
こんにちはRonさん、私たちのサポートチーム([email protected])があなたを手伝ってくれることを嬉しく思っています。私たちのために要求し、私たちは確かにそれに対応しています。 – Bam4d