40,000のタグ要素を持つ非常に大きなXMLファイルがあります。 このファイルを解析するために要素ツリーを使用しているとき、メモリのためにエラーが発生しています。 xml全体をメモリにロードせずに、データチャンク内のxmlファイルを読み取ることができるPythonのモジュールはありますか?そのモジュールはどのように実装できますか?チャンクでXMLファイルを解析する方法
2
A
答えて
2
おそらく、PythonでXMLを操作するための最良のライブラリはlxml
です。この場合、iterparse
/iterwalk
に興味があります。
+2
http://stackoverflow.com/questions/7171140/using-python-iterparse-for-large-xml-filesこれは大きなXMLを扱う際には注目に値するファイル。 –
2
これは、人々が通常サックスを使用して解決する問題です。
あなたの巨大なファイルが基本的にXML文書の集まりであり、全体的なXMLエンベロープである場合は、sax(または単純文字列解析)を使用して一連の個別ドキュメントに分解し、 lxml.etree。
関連する問題
- 1. PythonでXMLを解析する方法
- 2. jQueryでXMLを解析する方法
- 3. ASIHTTPでXMLを解析する方法
- 4. JAXBは大きなXMLファイルをチャンクで解析できますか
- 5. XMLファイルを解析する
- 6. 解析XMLファイル、
- 7. SSISでXMLファイルを解析する方法は?
- 8. VBAでXMLファイルを解析する方法
- 9. NSXMLParserでXMLファイルを解析する方法
- 10. TitaniumでローカルXMLファイルを解析する方法は?
- 11. C#でXMLファイルを解析する方法(youtube api result)?
- 12. androidでこのxmlファイルを解析する方法 - XmlPullParser?
- 13. ブラウザでローカルXMLファイルを解析する方法は?
- 14. Javaで高度なXMLファイルを解析する方法
- 15. XSLTでXMLファイルをインポートして解析する方法
- 16. C#でXMLファイルの再帰的ヘッダーを解析する方法
- 17. PHP - xmlを解析する方法
- 18. "ランダム" XMLを解析する方法
- 19. Objective cでXMLファイルを解析する
- 20. C#でXMLファイルを解析する
- 21. androidでxmlファイルを解析する
- 22. XMLファイルをフィルタで解析する
- 23. PHPでXMLファイルを解析する
- 24. Javaでfake-xmlファイルを解析する
- 25. 複数のファイル.gzチャンクをPythonでチャンクで解凍する方法
- 26. XMLファイルの解析
- 27. デルファイでMicrosoft.XMLDOMでxml-rpc formated xmlを解析する方法は?
- 28. Perl、XMLファイルを解析する方法、xpath
- 29. XMLファイルをリストに解析する方法は?
- 30. .txtファイルを.xmlに解析する方法は?
私はpythonistではありませんが、XMLを解析するためのSAX(DOMではない)aproachを探します。 –
問題がタグへのランダムアクセスを必要としない限り、SAXは完璧です。そうでない場合は、メモリ内のデータのよりコンパクトな表現を作成する方法がある場合でも、それを使用することができます。 –
lxmlが最適です.. IBMもお勧めします:) – codersofthedark