次のコードは、私が望むようにすべきですが、ループで20%完了するまでに10GBのRAMが必要です。パンダで非ユニークな列でインデックス付けされたDataFrame
# In [4]: type(pd)
# Out[4]: pandas.sparse.frame.SparseDataFrame
memid = unique(pd.Member)
pan = {}
for mem in memid:
pan[mem] = pd[pd.Member==mem]
goal = pandas.Panel(pan)
はSparseDataFrameの寸法( 'pd.shape')と密度(' pd.density')は何ですか?何が起こったのかを診断しようとするために私にオブジェクトのピクル( 'pd.save(file_path)')を電子メールで送ることができます。ところで、これらの質問は、SOよりもメーリングリストでうまくいくはずです。 –
pd.shape =(2668990,232) –
pd.density = 0.12814551216649045ファイルが大きすぎてメールで送信できません。 –