XMLファイルから特定のデータを抽出する必要があるだけでなく、抽出された要素が元のXMLファイルにある位置を知る必要があります。またはその行の行番号+位置。元のファイルの位置へのリンクを維持しながらPythonでXMLを解析する
よく使われるpython XMLライブラリは、このような機能を提供していないようです。
html5libの周りにカスタムラッパーを書くことによって解決された同様の質問Obtaining position info when parsing HTML in Pythonがあります。特定のデータはHTMLではないので、そのライブラリは私のためには機能しません。
要素の位置情報を保持するXMLパーサーがありますか、それとも独自の解析をロールバックする必要がありますか?
lxmlには 'sourceline'がありますが、これはあなたに行番号 – gsnedders