私は約4000,0000行と3列のCSVを持っています。私はPythonを読み込み、これらのデータを使ってデータフレームを作成したいと思います。私はいつもメモリエラーがあります。巨大なcsvを読んでデータフレームを作成する
df = pd.concat([chunk for chunk in pd.read_csv(cmct_0430x.csv',chunksize=1000)])
私も、発電機からのcreat pandas DataFrameを試しましたが、まだメモリエラーがあります。
for line in open("cmct_0430x.csv"):
yield line
私のコンピュータは、どのように私はこの問題を解決することができwin64,8G
のですか?どうもありがとうございました。
と回答しましたが、サイズはOKです。 とサイズがメモリ容量を超えている場合 - データフレームを格納することが不可能であるため、メモリ内に自己が存在します。 ファイルのフォーマットにいくつかの問題があると思います。たとえば、デフォルト以外のエンコーディング(asciiまたはutf8)でファイルを読み取ると、同様のエラーメッセージが表示されることがあります。 –
ファイルの小さいバージョンで問題なく動作しますか?全体をDataframeにロードすることができたとしても、フレームを扱う十分なスペースがない可能性があります。 – hpaulj
それは小さいfile.yesで動作します、私はそれを扱う十分な余裕がないかもしれないと思います。 – lemon