私はこの質問がconcatの実装についていくつかの洞察を必要とすると思います。は、パンダがインプレイス関数と連結していますか?
私は30ファイル、それぞれ1G、私は32 Gのメモリを使用することができます。私は 'list_of_pieces'と呼ばれるDataFramesのリストにファイルをロードしました。このリストは〜30Gサイズでなければなりませんか?
「pd.concat(list_of_pieces)」を実行すると、concatはヒープに別の30G(または多分10G 15G)を割り当て、いくつかの操作を実行するか、または新しいメモリを割り当てずに 'インプレース'の連結を実行しますか?
誰でも知っていますか?
ありがとうございます!
私は考えていない*それはインプレースだ...あなたは実際にはそれを多くのことをメモリに読んでみたいとは思わない(計算を実際に行う余裕はない)!私は[HDF5ストア](http://pandas.pydata.org/pandas-docs/stable/io.html#hdf5-pytables)があなたにとってはるかに良い選択だと思います。 –
@AndyHayden、私はメモリ内のデータのサイズが必要ではないかと心配しています。私はいくつかのインタラクティブな解析が必要です:-( –