のテキストやツリーをお読みください。しかし、それは通常のXMLのような構造を持っていませんexample.xmllxmlのPythonの、ここではサンプルファイルを参照、私はノードの下のテキストとIDを取得しようとしているXMLファイルの特定の構造
をファイル。構造は以下の通りである:私が欲しい
<TextWithNodes><Node id="0"/>
<Node id="1"/>
<Node id="2"/>9407011<Node id="9"/>
<Node id="10"/>ACL<Node id="13"/> <Node id="14"/>1994<Node id="18"/>
<Node id="19"/> Lg.Pr.Dc <Node id="29"/>
出力はstart_node
、end_node
とtext_between_node
のリストです。私はそれを行うためにlxml
ライブラリを使用できるかどうかはわかりません。
現在、私はXPathはあなたのために働くかもしれない使用
from lxml import etree
tree = etree.parse('9407011.az-scixml.xml')
nodes = tree.xpath('//TextWithNodes')[0].getchildren()
node = nodes[0] # example one node
print(node.text) # this give empty string because you don't have closing same id
あなたの試みと掲載サンプルまたはリンクを使用して、目的の結果を表示してください。 – Parfait