2011-09-14 37 views
0

xml.dom.minidomでODFドキュメントを解析しようとしています。テキストであるすべての要素を取得したいと思います。p OR text:h。 getElementsByTagNameメソッドにワイルドカードを追加する方法があるようです。またはそれは?getElementsByTagName(xml.dom.minidom)のワイルドカード

odf-documentをunoなしで解析する方法はありますか?

答えて

0

getElementsByTagNameはDOMElementリストを返すので、単に2つのリストを連結することができます。

また、XPathは演算子and/orをサポートしているため、これを使用することもできます。その場合は、代わりにelementTreeまたはlxmlモジュールを使用する必要があります。

+0

を与えるしかし、私は同じでそれらを必要とする代わりに、*

?を置きます木のように注文する。もし私がそれらを集中させると正しい順序が失われます。それは私に他の図書館を試してもらいますか? –

+0

テキスト:pとtext:hの間に1対1のマッピングがあると仮定すると、python zip関数を使用してタプルのリストを作成し、対応する要素text:hとtext:p要素。 –

+0

私はむしろlxmlを試して、私は思う... :) Thnx –

0
root_element.getElementsByTagNameNS('text', '*') 

は多分これが私のために働いたが、他の方法は、周りの

<325t4342:Key> fooo </.....>... 

key = (root_element.getElementsByTagNameNS('*', "Key")[0]).firstChild.data.strip() 

私に "foo" という