これに似た質問がありますが、私のデータフレームがHDFStoreの内部にある場合を処理するものはありません。キー/値のペアのリストをHDFStoreに保存されたパンダのデータフレームに変換する
タイムスタンプ/キー/値アイテムのリストをデータフレームに変換し、タイムスタンプにインデックスされた複数のデータフレームとして保存し、HDFStoreに保存する必要があります。
例コード:
from pandas import HDFStore
from pandas import DataFrame
store = HDFStore('xxx', driver="H5FD_CORE")
for i, k, v in ((0, 'x', 5), (1, 'y', 6)):
if k not in store:
store[k] = DataFrame()
store[k].set_value(i, 'value', v)
このコードが実行された後、store['x']
は空のままです。
>>> store['x']
Empty DataFrame
Columns: []
Index: []
だからそれが持続されていない理由いくつかの理由が明らかに存在し、そしてそれは確かにも、私はちょうどこのようなものが動作するようになっているのか分からない場合です。 HDFStore内のテーブル/データフレームにどのように追加するかを理解していれば、確かにそのロジックを理解することができます。
データフレームをメモリに保存して、何らかの辞書で保存して、最後にHDFStoreに割り当てることもできます。私はどういうわけかこの方法でメモリーを節約するという誤った考え方をしていました。おそらく私もそれについて間違っています。
「タイムスタンプ/キー/値」データセットのサンプルを提供できますか?どのような形式でそれらを入手していますか? – MaxU
私はそれを意図的に少し愚かにした。データそのものは、バイオメトリックセンサーを使用して人体から取得したタイムスタンプおよび測定値を含むプロトタイプレコードの繰り返し可能なものです。私が望むのは、メトリックごとのデータフレームです。タイムラインとタイムスタンプにインデックスされた値の2つの基本的な列です。次に、これらのデータフレームをすべて1つのHDFStoreに配置します。私の選択ではなく、研究者が望むものです。 – izak