私は現在、RSSフィードで製品情報を提供している第三者と協力しています。DrupalのRSSフィードコンテンツの処理
私たちのDrupal 6サイトは、RSSフィード(製品)の各フィード(カテゴリ、本質的に)からインポートし、その結果のノードをショップページに表示します。フィードモジュールを使用します。
これまでのところ、このシステムは1年以上働いています。
私の質問は、RSSフィードのコンテンツをより多く抽出する方法です。
私が言っていることは、価格はフィードの一部ですが、私たちのサイトはデータベース内のエンティティとして価格を持っていないということです。ちょうどHTMLの塊を持っています。
私はカスタムCCKフィールドに値段をつけたいので、私たちは物事などをリストする方法を少し巧みにすることができます。
私はDrupalのテーマをはるかに超えたことはありませんでしたが、PHP/XPath/DOMには快適です。私自身のフィード。
何らかの方法で準最適なものをハッキングするのではなく、どのようにすればよいのか誰にでも提案できますか?カスタムフィードインポートモジュール?ノードを後処理するDrupalの他のフックですか?
編集:
明確にするために、我々は現在、フィードモジュール(6.xの-1.0-β)を使用し、CCKフィールドにRSSのタイトル、説明、日付などをマッピングします。
私がしたいことは、さらに進んで、RSSの 'description'フィールドのHTMLコンテンツを解析することです。
更新:
http://drupal.org/project/feedapi_scraper
これは、私が後だかの並べ替えを行うように見えますが、常に私のDrupalのモジュールと神経質ビットを作るこれ、広く使われて見えません。私はそれに行くと報告を返すよ。
クライブのお返事ありがとうございます。私は私の質問で十分にはっきりしていないと思います(私はそれを更新します):FeedAPIの後継プロジェクトである「フィード」を使用しています。問題は、定義された要素を抽出するのではなく、RSSフィードの本文から詳細を抽出することです。 – Leo