最近Pythonを使用していて、特定のxmlファイルから情報を抽出したいのですが、問題は、このような形式で情報が実際にひどく保存されていることです。Pythonでxmlコメントを正しく解析するには
<Content>
<tags>
....
</tags>
<![CDATA["string1"; "string2"; ....
]]>
</Content>
約20,000行であるため、ここにデータ全体を掲載することはできません。 は、私はちょうど[「文字列1」、「文字列2」、...]を含むリストを受け取るしたい、これは私がこれまで使用してきたコードです:私の出力はどれも
import xml.etree.ElementTree as ET
tree = ET.parse(xmlfile)
for node in tree.iter('Content'):
print (node.text)
ではありませんが。どのように私はコメントのデータを受け取ることができますか? (再び、私はPythonを使用しています)
ただ一つの行が必要な場合は、ファイルを開いてstring/regex関数で行を探してみてください。 – trans1st0r
も参照してください。http://stackoverflow.com/questions/541100/finding-top-level-xml-comments-using-pythons-elementtree – trans1st0r
リストの要素として約20000行があると言ったように、1行ではありません。 。 – WodkaRHR