2
私はPythonで多数のファイルを処理しており、HDF5
に出力(各入力ファイルごとに1つのデータフレーム)を書き込む必要があります。 私のスクリプトのpandas
データフレームを直接HDF5
に直接書き込む最良の方法は何ですか?私はhdf5のような任意のpythonモジュール、hadoopyがこれを行うことができるかどうかはわかりません。この点に関する助けに感謝します。HDF5にパンダデータフレームを書き込む
http://matthewrocklin.com:私は(あなたはHDF5ファイルを読み込みますときに、後で
where
パラメータでこれらの列を使用できるように)インデックスを作成する必要があります列を指定するためにdata_columns
パラメータを使用すること/ blog/work/2016/02/22/dask-distributed-part-2 –NickilはHDFSをHDF5に変更するための編集を提案しましたが、これに基づいて回答しましたが、HDFSとHDF5の両方があなたの質問の文脈で意味をなさないようです...どういう意味ですか? – Foon