2017-05-10 12 views
1

私は一般的にRSSのURLのために働いているスクリプトでfeedparserを使用していますが、私に頭痛を与えている1つのURLがあります:tabbforum.com/feed.atomFeedparser SAXParseExceptionの、ボゾ:1

私はSAXParseException('not well-formed (invalid token)',)を取得します。

import feedparser 

def read_from_feed(self, rss_url): 
    feed = feedparser.parse(rss_url) 
    for entry in feed.entries: 
     print('do stuff') 


>>>>feed 
{'feed': {}, 'entries': [], 'bozo': 1, 'encoding': 'utf-8', 'version': '', 'bozo_exception': SAXParseException('not well-formed (invalid token)',), 'namespaces': {}} 

xml(?)に問題があると私は考えています。誰も以前の経験を持ち、回避策を見つけることができましたか?または、問題が何であるか考えているか?

答えて

1

同様の問題がありました。私の場合は、http://をURLの前に置くのを忘れていました。フィードパーザーはそれをURLではなくRSS XMLとして扱いました。

+1

これは機能します。私はこれを試したと確信していたが、明らかにそうではなかった。ありがとうございました! – malla

関連する問題