私は財務データを持つ大きなパンダのデータフレームを持っています。 追加の列とDataFramesを.h5ファイルに追加して連結しても問題はありません。 財務データが毎分更新されているため、毎分.h5ファイル内の既存のすべてのテーブルに1行のデータを追加する必要があります。 これまでのところ私が試したことはありますが、私が何をしても、.h5ファイルを上書きしてデータを追加するだけではありません。 H
PyTables HDF5テーブルに保存するすべての値は実数です。これにより、通常のテーブルよりも2次元配列を選択することが論理的になります。しかし、配列の多くのセルでは値が利用できなくなる可能性があります(そして後で利用可能になります)。これを示す妥当な簡単な方法はNaNをセルに割り当てることです(私が理解する限り、Noneを置くことはできません)。 私は、テーブルに次のよう作成してもらう: w
multiprocessing.dummyパッケージとdeepdishに圧縮されたh5ファイルを書き込む際に問題があります。 は、これは私がやっているものです:私は、コマンドを保存するdeepdishコメント際 import deepdish as dd
from multiprocessing.dummy import Pool
def writeThings(args):
pa
- : ブロックアレイは データ空間から選択された要素ブロックのサイズを決定します。 例はfollowing-に設定されたパラメータを有する2×2データセットで示す: start offset is specified as [1,1], stride is [4,4], count is [3,7], and block is [2,2]
21は2×2ブロックをもたらすであろう。選択肢が(1