78TB HDF5データセットを2dブロックパーティション方式で作成しようとしています。これは、書込み中のブロックが書かれていない行にまたがるときに非常に遅くなります。なぜなら、HDF5はディスクスペースを割り当てて、欠落しているエントリをゼロで埋めるためです。h5pyを使用して、早期割り当てと無しでhdf5データセットを作成する方法
代わりに、作成したデータセットのディスクスペースをh5pyに割り当てて、それを決して埋めることはできません。これは表16のthe HDF5 Dataset documentationのC APIで可能ですが、どのようにしてh5pyでこれを行うことができますか?
私は、ファイルが作成された行を忘れてしまった、これは直前になりますcreate_dataset呼び出し:f = h5py.File( 'mybigdset.h5'、 'w') –
ok - これを追加しました。 –
提案に感謝します。私はアクセスが行のブロックになるアプリケーションで使用するためにこのファイルを生成していますので、チャンクを使用したくありません。 – AatG