2017-12-01 27 views
0

私は巨大なデータセットを持っており、それを1行ずつ読み込もうとしています。今の は、私はパンダを使用してデータセットを読んでいます:ようにパンダでCSVの特定の行番号を読み取る方法

df = pd.read_csv("mydata.csv", sep =',', nrows = 1) 

この機能は、私が最初の行のみを読み取ることができますが、どのように私は2番目を読み取ることができ、三番目と? (私はパンダを使用したいと思います。)

EDIT: それをより明確にするために、私は、データセットが20ギガバイトであると私はメモリ内のすべてのものを維持することはできませんと一度に1行を読んでする必要があります。あなたはnrows = 1を使用している

+0

私はデータセット全体を読み取ることができません、それは20GBです。この時間はありません。@ SandeepKadapa –

答えて

1

はパンダのドキュメントでみると、read_csv機能のためのパラメータがあります:

skiprows 

リストは、それはスキップされます。このパラメータに割り当てられている場合一覧によって索引される行:

skiprows = [0,1] 

これは、最初の行と2番目の行をスキップします。 nrowskiprowsの組み合わせにより、データセット内の各行を個別に読み取ることができます。

0

、ウィッヒは「読み込むファイルの行数を。大きなファイルの読み込みの作品のために有用な」意味

をですから、最初の行だけを読んで停止するように指示されています。

すべてのcsvファイルをDataFrameに読み込んで1行ずつ表示するには、引数を削除するだけです。

使用方法の詳細については、マニュアルを参照してください:https://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html

+0

データセット全体を読み取ることができないことを明確に述べるように質問を更新しました。 –

関連する問題