私は350 MB以上のデータを持つフォーマットの悪いxmlファイルを持っています。基本的には、すべてのデータを1行にまとめました。私は人生を楽にするためにこれを新しいファイルにpretty_printしようとしていますが、記憶上の問題にぶつかっています。私はここで何か悪いことをしていますか?これを回避する方法はありますか?私のコンピュータは、4GBのRAMを持っているとされクアッドコアi5-2410M(2.30Ghz)lxml pretty_print pythonメモリオーバーロード
import os
from lxml import etree
parser = etree.XMLParser(remove_blank_text=True)
tree = etree.parse('filename',parser)
f = open('filename',"w")
f.write(etree.tostring(tree,pretty_print=True))
f.close()
文書をフォーマットしたいだけなら、 'xmlformat'は素晴らしいユーティリティです:http://www.kitebird.com/software/xmlformat/ – GaretJax