Python -lxml xpathは空のリストを返します

私はxliffファイルを読んでおり、特定の要素を取得しようとしています。私が使用しているすべての要素を印刷しようとしたPython -lxml xpathは空のリストを返します

from lxml import etree 
with open('path\to\file\.xliff', 'r',encoding = 'utf-8') as xml_file: 
     tree = etree.parse(xml_file) 
    root = tree.getroot() 
for element in root.iter(): 
     print("child", element)

出力I（ここでは、多くの記事の助けを借りて）特定の要素を取得しようとすると

child <Element {urn:oasis:names:tc:xliff:document:2.0}segment at 0x6b8f9c8> 
child <Element {urn:oasis:names:tc:xliff:document:2.0}source at 0x6b8f908>

だった - ソースタグ

segment = tree.xpath('{urn:oasis:names:tc:xliff:document:2.0}segment') 
print(segment)

空のリストを返します。誰かが適切にそれを取得する方法を教えてもらえますか？

入力：

<?xml version='1.0' encoding='UTF-8'?> 
<xliff xmlns="urn:oasis:names:tc:xliff:document:2.0" version="2.0"> 

    <segment id = 1> 
    <source> 
     Hello world 
    </source> 
    </segment> 
    <segment id = 2 > 
    <source> 
     2nd statement 
     </source> 
    </segment> 
</xliff>

私はセグメントの値と、それに対応するソース

出典

2017-08-14 shan

' '{URN：オアシス：名：TC：XLIFF：ドキュメント：2.0} segment''は' XPath'表現 – Andersson

@Anderssonではありません。そして、あなたは、ツリー全体を検索する.//を追加する必要がありますしようとしましたtree.findall（ '{urn：oasis：names：tc：xliff：document：2.0} segment'） - まだ空リストを返す – shan

HTMLソースサンプルと所望の出力を共有する – Andersson

このコードを取得したいが、

tree.xpath('{urn:oasis:names:tc:xliff:document:2.0}segment')

はlxmlの（「lxml.etreeによって受け付けられません。 XPathEvalError：無効な式 "）。 findall()を使用する必要があります。

from lxml import etree 

tree = etree.parse("test.xliff") # XML in the question; ill-formed attributes corrected 
segment = tree.findall('{urn:oasis:names:tc:xliff:document:2.0}segment') 
print(segment)

しかし、実際のXMLは明らかに、より複雑である（segmentがxliffの直接の子ではありません）：

次の作品は（XMLのサンプルでは、segment要素はxliffの子です）。

segment = tree.findall('.//{urn:oasis:names:tc:xliff:document:2.0}segment')

出典

2017-08-14 10:33:16 mzjn

Python -lxml xpathは空のリストを返します

答えて

関連する問題