xmlの文書からタイトルとpubDate要素を取得

-1

私はPythonには初めてです。 "title"と "pubDate"要素のテキストが必要ですが、これらの要素の最初のインスタンスからのみです。私は "lxml"しようとしています：xmlの文書からタイトルとpubDate要素を取得

tree=etree.parse('doc.xml') 
x = tree.findtext("rss/channel/item/title") 
y = tree.findtext("rss/channel/item/pubDate") 
print x, y

私は出力に何も得られません。テキストを検索しますが、あなたは、XPathによってノードを探しているので、xpath方法使用

<rss version="2.0"> 
<channel> 
    <title>Dynamic rss from aaaa.aaaa search</title> 
    <link>http://aaaaa.aaaa.info</link> 
    <ttl>30</ttl> 
    <description>RSS feed for selected show/news</description> 
    <item> 
    <title> 
    <![CDATA[ AAAAAAA 7x16 (HDTV-LOL) [VTV] ]]> 
    </title> 
    <pubDate>Mon, 13 Feb 2012 00:00:00 GMT</pubDate> 
    <link> 
    <![CDATA[ 
http://torrent.zoink.it/AAAAAAAA.7x16.(HDTV-LOL)[VTV].torrent 
]]> 
    </link> 
    <description> 
    <![CDATA[ 
AAAAAAAA 7x16 (HDTV-LOL) [VTV] - http://torrent.zoink.it/AAAAAAA.7x16.(HDTV-LOL[VTV].torrent 
]]> 
    </description>

出典

2012-02-21 koogee

-1不正な形式のXMLを送信しています。 –

findtext：[]

>>> tree.xpath("/rss/channel/item/title") 
[<Element title at 107c2b8>] 
>>> tree.xpath("/rss/channel/item/pubDate") 
[<Element pubDate at 107c3c0>]

注：xpathメソッドの戻りをここはXMLファイルです要素のリスト

出典

2012-02-21 15:04:04

よかったよ – koogee

xmlの文書からタイトルとpubDate要素を取得

答えて

関連する問題