2017-01-25 7 views
0

私のような塊からDFを生成したい:コンピュータのRAMが唯一の3ギガバイトで、CSVファイルは以下のように3ギガバイト以上のものですがCSVチャンクまたはオフライン

chunksize = 1 
df_list = [] 
for chunk in pd.read_csv(filename, chunksize=chunksize): 
    df_list.append(chunk) 
data_raw = pd.concat(df_list) 

a b c  d  e  f  g  h i j ...  \ 
0 2 2 0 8.17680 4.76726 25.6957 1.13633 0 3 4.8 ...  
1 3 0 0 8.22718 2.35340 15.2934 1.13633 0 3 4.8 ... 

Xをトレーニングするためのデータを分離するためにチャンクでdfを生成したいのですが、Xをトレーニングする "ae"やその後にyをテストする "gh"などいくつかのフィールドでyをテストします。 seperate関数の入力タイプはdfです。 チャンクやcsvオフラインからdfを生成するいくつかの具体的な例を教えてください。

答えて

関連する問題