0
この質問はthis one from 2013と関連しているようですが、それは私を助けませんでした。Python ElementTreeエスケープ文字(XML)に到達するときのiterparseからのParseError
私は大きな(2GB)XMLファイルを解析しようとしており、Python 3.5.2とElementTreeを使ってXMLファイルを解析しようとしています。私は、Pythonに新たなんだけど、それはのような、任意のエスケープ文字に達するまでうまく機能:
<author>Sanjeev Saxöna</author>
を返す:
import xml.etree.ElementTree as etree
for event, elem in etree.iterparse('test_esc.xml'):
# do something with the node
:
test.xml
File "<string>", line unknown
ParseError: undefined entity ö: line 5, column 19enter code here
私のコードは次のようになりますこれに対処する最良の方法は何ですか?エスケープされていない「O」を構文解析すると、実際に正常に動作します:
<author>Sanjeev Saxöna</author>
は、プログラム全体のXMLファイルをアンエスケープする簡単な方法はありますか?
ここに回答があります。 –
ありがとうございます!その答えは私を助けました。 –