非常に大きなndarrayをディスクに保存するにはどうすればいいですか?非常に大きなndarrayをディスクに保存するには?
データの複製を含むすべての解決策は認められませんのでご注意ください。例えば
、このコード
x = pandas.HDFStore("some_file.hdf")
x.append("a", pandas.DataFrame(a))
はunapprovable重複メモリ使用
pandas.DataFrame(a)
を含みます。
明白なコード
pickle.dump(a, f)
ハング。
あなたは 'pickle'のいくつかの選択肢を調べましたか?いくつかのアイデアはここにあります:http://www.benfrederickson.com/dont-pickle-your-data/ – abagshaw
私はcPickleを試して、それが4GBの破られない限界を見つけました。また、MessagePackを見ても、それを使ってデータをシリアライズする方法を理解していません。 JSONを試してみませんでした。なぜなら、テキストを書くことは効果的ではないと思ったからです。 – Dims
'np.save'で処理できますか?そうでない場合は、正確にどのくらいのデータですか? – user2699