私はPythonで新しくなっています。 Recenty、私はxmlファイルで膨大な量の健康データを処理するプロジェクトを持っています。私のデータで大きなデータのpythonを格納
は、約100それらのがあり、それらのそれぞれが異なるID、起源、種類やテキストを持っている: はここでの例です。私はこのデータセットを訓練できるように、すべてのデータを保存したいと思っていました。私の心の最初のアイデアは、2D arry(1つのidとoriginを格納するもう1つのstore text)を使用することでした。しかし、機能が多すぎるとわかったので、どの機能が各文書に属しているかを知りたい。
誰もが最良の方法をお勧めしますか?拡張性、シンプルさとメンテナンスのために
idをキーとする辞書と、キーとしての機能と値としての値を持つ辞書、または値としてのオブジェクトのいずれかを使用すると、おそらく離れてしまうことがあります。 – DeepSpace
画像をあなたの質問にコピーしましたが、画像ではなく、 '{}'を使って関連するコードを投稿することをお勧めします。 – Leb
あなたの問題が解決するまで、xmlパッケージの解析パッケージを使用して、辞書または可能なデータフレームにインポートできるデータを取得することをお勧めします。それが今立つところでは、あなたの質問は広すぎます。 – Leb