2012-02-21 6 views
-1

私はPythonには初めてです。 "title"と "pubDate"要素のテキストが必要ですが、これらの要素の最初のインスタンスからのみです。私は "lxml"しようとしています:xmlの文書からタイトルとpubDate要素を取得

tree=etree.parse('doc.xml') 
x = tree.findtext("rss/channel/item/title") 
y = tree.findtext("rss/channel/item/pubDate") 
print x, y 

私は出力に何も得られません。テキストを検索しますが、あなたは、XPathによってノードを探しているので、xpath方法使用

<rss version="2.0"> 
<channel> 
    <title>Dynamic rss from aaaa.aaaa search</title> 
    <link>http://aaaaa.aaaa.info</link> 
    <ttl>30</ttl> 
    <description>RSS feed for selected show/news</description> 
    <item> 
    <title> 
    <![CDATA[ AAAAAAA 7x16 (HDTV-LOL) [VTV] ]]> 
    </title> 
    <pubDate>Mon, 13 Feb 2012 00:00:00 GMT</pubDate> 
    <link> 
    <![CDATA[ 
http://torrent.zoink.it/AAAAAAAA.7x16.(HDTV-LOL)[VTV].torrent 
]]> 
    </link> 
    <description> 
    <![CDATA[ 
AAAAAAAA 7x16 (HDTV-LOL) [VTV] - http://torrent.zoink.it/AAAAAAA.7x16.(HDTV-LOL[VTV].torrent 
]]> 
    </description> 
+0

-1不正な形式のXMLを送信しています。 –

答えて

1

findtext[]

>>> tree.xpath("/rss/channel/item/title") 
[<Element title at 107c2b8>] 
>>> tree.xpath("/rss/channel/item/pubDate") 
[<Element pubDate at 107c3c0>] 

注:xpathメソッドの戻りをここ はXMLファイルです要素のリスト

+0

よかったよ – koogee

関連する問題