他のものよりも使い易いかどうかはわかりませんでした。 Java、PHP、またはPerlです。RSSフィードをスクラップしたい場合はどのようなプログラミング言語を使用しますか?
答えて
最高のものは、あなたが最も快適に働くことです。
ジョブを実行するのに適切なツールを使用している限り、実際には問題ありません。
アプリケーションを配備する場所(Web対デスクトップ)、新しいテクノロジ/言語の学習に費やす時間、RSSやXML、および/またはHTMLを解析するためのライブラリの可用性を考慮する必要があります。あなたが名前を挙げた3つの言語はすべて良い候補です。
RSSファイルは、インターネット経由で入手した形式のXMLです。あなたが言語で必要とするのは、HTTPリクエストを行うことができ、XMLを解析する方法があることだけです。
フレームワークコードは何でも構いませんが、XSL変換(またはXPathクエリ)を使用してXMLをより美味しい形式にすることを検討してください。 Espec。あなたがデータの小さなサブセット、または個々の値を探しているならば。
ソースデータが最初に機械で解析されることになっていたのでは、ほとんど「掻き集める」ことはありません。 :)
特定のテクノロジがより強力で、デッドライン(またはその他の要因)がある場合は、すべての機能を備えているので、そのテクノロジに従ってください。
これが当てはまらない場合、それはあなたが取り組んでいるプロジェクトの要件になります。また、新しい技術を習得したい/習得することができます。
PHPは最も自然にWebベースのテクノロジーであり、このようなライブラリを使用してSimple HTML DOM Parser(XMLもサポートしています)を使用して、PHPがサポートするWebスクレイピングの複雑さを深く掘り下げて調べることができます。
Javaは良い結果を持つ過去に使用したWeb Harvestという素晴らしいプロジェクトを持っています(非標準のxml構文を学んでいますが、xsltと似ていますが)。システムがあなたのWebスクレイピングを設定すると簡単に変更することができます。
Perlはregex(Java、特にPHPは私が見つけたregexで作業するとちょっと乱雑になることがあります)とregexはあなたの情報で何をしたいのかに応じてもっとも優れていますreasnobleオプションです。
頻繁に実行し、多数のサイトにコンテンツを集約する必要があるサーバーアプリケーションを作成する場合は、パフォーマンスが重要な基準になります。これは大量のデータをすばやく処理できる言語を意味します。
時折実行し、多くのページからデータのビットを選ぶだけのプログラムが必要な場合は、特殊な言語を検討することができます。製品TestPlanは、RSSコンテンツをすばやく取得し、簡単な方法で公開できるようにする非常に単純な言語を提供します。
私はこれを重要なスクレイピングプロジェクトで使用しました。驚くほど高速ではありませんが、スクリプトは非常に保守しやすいです。
- 1. ゲームエンジンと3Dモデリングソフトウェアを使用している場合は、どのようなプログラミング言語を使用しますか?
- 2. PhpStormはどのプログラミング言語でプログラミングされましたか?
- 3. RSS/Atomフィードの作成:テンプレート言語またはXMLライブラリ?
- 4. これはどのようなプログラミング言語なのですか?
- 5. グラフAPIを使用したRSSフィードのコメントとどう違うのですか?
- 6. RSSフィードからアジア言語をフィルタリングする方法は?
- 7. RSSフィードを使用したMicrosoft Botフレームワーク
- 8. Dプログラミング言語でインクリメンタルガベージコレクタを使用していますか?
- 9. これはどのようなプログラミング言語ですか?
- 10. プログラミング言語がcamelCaseを使用している場合、PostgreSQL識別子の下線またはキャメルケース?
- 11. RSSフィードのリンクからRSSフィードのリンクを見つけよう
- 12. どのプログラミング言語が言語レベルの状態をサポートしていますか?
- 13. xAgentを使ってRSSフィードを読むには?私はxAgentを使用して外部のRSSフィードを読み込むしようとしています
- 14. 異なるGPL(汎用プログラミング言語)を使用して実装されたDSL(汎用プログラミング言語)
- 15. 他のプログラミング言語のphoenixフレームワークライブラリを使用しています
- 16. プログラミング言語プロジェクトを使用して
- 17. PHPなどのプログラミング言語でメールを確認しますか?
- 18. RSSフィードを持たないウェブページからRSSフィードを作成するには
- 19. Juliarプログラミング言語をlighttpdにどのように使用するのですか?
- 20. グラフを解釈するためにどのようなプログラミング言語を使用できますか?
- 21. ダミーのプログラミング言語をお探しの場合
- 22. TOSCAはどのプログラミング言語でプログラミングされていますか?
- 23. プログラミング言語を使用してErlang(k)変数をどのようにシミュレートしますか?
- 24. 論理プログラミングのためのPrologより新しいプログラミング言語
- 25. RSSフィードが変更されていない場合は何もしない
- 26. ステートメントセパレータとして「セミコロン」を使用した最初のプログラミング言語
- 27. 関数型プログラミング言語はどのように実装しますか?
- 28. プログラミング言語/ライブラリはハードウェアとどのように通信しますか?
- 29. Androidプログラミングでユーザーが選択した言語(またはロケール)はどのように決定しますか?
- 30. iPhoneアプリケーションにはどのようなプログラミング言語が使用されていますか?