0
私は3ギガバイトのファイルを持っているとpd.read_csv(...)
は大きなデータフレームの最初のチャンクを読み取る方法は?
df = pd.read_csv("train.csv", chunksize=10**6)
for chunk in df:
print chunk
break
がより正しいとは何ですか(悪いスタイルで)ので、代わりに私が書いた私のiPythonノートパソコンがクラッシュ?私はちょうど最初の百万行を見たいと思う。
どういう意味ですか?最初の100万行を表示するには、3行すべてが必要です。実際には、ディスクIOは一般的にCPUよりも遅いため、小さな部分で読むことをお勧めします。 – Kartik