大きなデータセットをデータフレームのパンダに連結する方法

私は、数百メガバイトの非常に大量のCSVデータセットを扱っています。私は塊（〜100行）のデータを読み込むことができました。これらのチャンクをエレガントにデータフレームに変換して、それにdescribe関数を適用するにはどうしたらいいですか？は、あなたがread_csvの出力が何であるかをTextFileReaderオブジェクトのconcat必要があると思われるあなた大きなデータセットをデータフレームのパンダに連結する方法

出典

2017-03-22 Linkx_lair

ありがとうございました場合describeとパラメータchunksize：

とても美しいです

df = pd.concat([x for x in pd.read_csv('filename', chunksize=1000)], ignore_index=True) 
df = df.describe() 
print (df)

出典

2017-03-22 15:13:16 jezrael

。 concatとappendはいつ使用しますか？ –

私は 'list comprehension'が' concat'を使うほうが良いと思います。 – jezrael

大きなデータセットをデータフレームのパンダに連結する方法

答えて

関連する問題