xml.dom.minidomでODFドキュメントを解析しようとしています。テキストであるすべての要素を取得したいと思います。p OR text:h。 getElementsByTagNameメソッドにワイルドカードを追加する方法があるようです。またはそれは?getElementsByTagName(xml.dom.minidom)のワイルドカード
odf-documentをunoなしで解析する方法はありますか?
xml.dom.minidomでODFドキュメントを解析しようとしています。テキストであるすべての要素を取得したいと思います。p OR text:h。 getElementsByTagNameメソッドにワイルドカードを追加する方法があるようです。またはそれは?getElementsByTagName(xml.dom.minidom)のワイルドカード
odf-documentをunoなしで解析する方法はありますか?
getElementsByTagNameはDOMElementリストを返すので、単に2つのリストを連結することができます。
また、XPathは演算子and/or
をサポートしているため、これを使用することもできます。その場合は、代わりにelementTree
またはlxml
モジュールを使用する必要があります。
root_element.getElementsByTagNameNS('text', '*')
は多分これが私のために働いたが、他の方法は、周りの
<325t4342:Key> fooo </.....>...
key = (root_element.getElementsByTagNameNS('*', "Key")[0]).firstChild.data.strip()
私に "foo" という
を与えるしかし、私は同じでそれらを必要とする代わりに、
*
の
?
を置きます木のように注文する。もし私がそれらを集中させると正しい順序が失われます。それは私に他の図書館を試してもらいますか? –テキスト:pとtext:hの間に1対1のマッピングがあると仮定すると、python zip関数を使用してタプルのリストを作成し、対応する要素text:hとtext:p要素。 –
私はむしろlxmlを試して、私は思う... :) Thnx –