2017-06-14 8 views
0

49700行と790列のデータフレームがあります。私は最大値を持つ列は何列ごとに取得しようとしています。以下は私のコードです:df.idxmaxを使用しようとするとメモリ不足になる

df['Max'] = df.idxmax(axis = 1) 

私はメモリエラーが発生しています。どのように私はこの問題に対処することができる方法はありますか?

+0

この行にはメモリエラーがありますか?この関数のメモリオーバーヘッドは比較的小さくなければなりません。また、データフレーム全体は350-400 MBでなければならないので、私は他の何かがメモリエラーに関わっていると考えます。 – Sebastiaan

+0

あなたの列の種類は何ですか? – chrisb

+0

@chrisb列は長いデータ型です。 –

答えて

0

あなたは32ビットシステムですか? 32ビットシステムでのデータフレーム操作に関するメモリの問題もあります。データフレームには〜350MBのcsvファイルが含まれています。

私のスクリプトは複数のデータフレームで動作するため、このデータフレーム操作の前に、他のいくつかのデータフレームをメモリから削除することができました。 他のデータフレームを「なし」に設定しています。

関連する問題