2016-08-14 20 views
0

奇妙ではないかもしれませんが、今後のプロジェクトで使用している2つのXMLやPHPを使用したことはありません。変なXMLフィードの解析

とにかく、私はthis XMLフィードを解析しています。各<item><enclosure url=...>

どこ

feed = feedparser.parse("http://www.huffingtonpost.com/feeds/verticals/good-news/index.xml") 
l = feed.entries[12]['title']` 

だけで罰金を使用することができますfeedparserを使ってPython 3では... =のURL &画像の種類など

が含まれていますが、私は、画像のURLを取得しようとすると、使用例:

p = feed.entries[12]['enclosure']

私は明らかにenclosureは何で戻って来ていない、私はXMLで、それは代わりに、それは

<enclosure url=... blah blah blah /> 
を使用しています

<name of object>Text</name of object> 

を使用しないため、これは疑うエラー

Traceback (most recent call last): 
    File "<pyshell#28>", line 1, in <module> 
    p = feed.entries[12]['enclosure'] 
    File "C:\Python34\lib\site-packages\feedparser-5.1.3-py3.4.egg\feedparser.py", line 375, in __getitem__ 
    return dict.__getitem__(self, key) 
KeyError: 'enclosure' 

を取得

URLの値はどのように取得できますか?これは、文字列に等しい(url="url is here"

答えて

0

のエントリを使用してみてくださいfeedparse docsを見る[i]はリンクされたファイルのURLを返し参照.HREF .enclosures [J]:

feed = feedparser.parse("http://www.huffingtonpost.com/feeds/verticals/good-news/index.xml") 

l = feed.entries[12].enclosures[1].href