2017-12-02 7 views
0

rssのメタデータの特定の属性のみをダウンロードするにはどうすればよいですか? 「土、2017年12月2日07:私はユニバーサルfeedparserライブラリを使用していPython:ダウンロード/解析* rssエントリのpubdateタグ

feedparser.parse(linkstr).entries [0]

私が印刷された場合は、このような何かを返し、この行を、持っている

を.published: 00:34 Z "

私の質問は、フィード全体をダウンロードして、最初の投稿の投稿日だけを投稿するのですか?または、それはpubdateだけをダウンロードしますか?

前者の場合、特定の属性のみをダウンロードするにはどうすればよいですか?これは5分ごとにチェックを実行するボットのため、フィード全体を5分ごとにダウンロードすることは実現不可能でひどく非効率的です。

答えて

0

電子タグ/最後に変更されたヘッダーを使用しないのはなぜですか? -

https://pythonhosted.org/feedparser/http-etag.html

+0

おかげで、やはり間の任意の実際の差がある:(linkstr).entries [0] .published_pa​​rsed feedparser.parse又は feedparser.parseは(linkstr).modified_pa​​rsed? 2番目の例は、あなたが提供したリンクに記載されているものです – xland44

+0

電子タグおよび/または最後に変更されたヘッダーを使用すると、クライアントは前回のキャッシュされた要求の変更をチェックします。これらのヘッダー。ドキュメントでは、最後に変更されたヘッダーとeタグのヘッダーの両方を含める方が良いのは、サポートされているサーバーによって異なるためです。あなたの例では、実際にRSSフィードをダウンロードし、あなたはエントリをチェックしていますが、eタグ/ last-modifiedヘッダメソッドを使ってフィードをダウンロードすることはできません。 –

関連する問題