2017-10-29 12 views
1

新しいcsvファイルを既存のものから作成しようとしています。私の元のcsvファイルには300,000のレコードがあり、うち200,000レコードが最初に必要です。私は現在、機械学習プロジェクトに取り組んでいるため、Pythonのpandasパッケージを使用しています。 私が試してみた:Pandasパッケージを使用して最後の100k行を削除して既存のcsvファイルを作成する

import pandas as pd 

df = pd.read_csv('sample_submission.csv') 
df = df.head(2000002) 
df.to_csv('solution.csv') 

など

import pandas as pd 

df = pd.read_csv('sample_submission.csv') 
df = df[:2000002] 
df.to_csv('solution.csv') 

しかし、ノー成功

。私の目標を達成するために何をすべきですか?

答えて

2

最後にN行を省略すると、skipfooterパラメータが必要になると思います。

df = pd.read_csv('sample_submission.csv', skipfooter = 1000000) 

読み出された第1のN行がread_csvでパラメータnrowsを使用したい場合:

df = pd.read_csv('sample_submission.csv', nrows=2000002) 
+0

skipfooterパラメータは感謝 – HrishikeshKulkarni

+0

どういたしまして...作品! – jezrael

関連する問題