私はfread
を使用して7.7ギガバイトのファイルを読み込むしようとしているの後にCSVを読んで停止しますが、私はそれだけでファイル途中で取得した後に読んで停止したことを示唆しているエラーを取得:関数freadは4ギガバイト
cdr <- fread('/path/to/data.csv')
Read 1687 rows and 610989 (of 610989) columns from 4.000 GB file in 00:02:37
Warning message:
In fread("/path/to/data.csv") :
Stopped reading at empty line 1688 but text exists afterwards (discarded)
cdr <- fread('/path/to/data.csv', nrows = 2000)
Read 0.0% of 2000 rows
Error in fread("/path/to/data.csv", nrows = 2000) :
Expected sep (',') but new line or EOF ends field 500054 on line 1688 when reading data
注意していますエラーメッセージには、ファイルのサイズは4.000 GBですが、実際には7.7 GBです。同様に、エラーメッセージは、ファイルに1687の行があることを示しますが、実際には3378の行があります。
私はこのファイル(thanks @MrFlick for the suggestion)に空行がないことを再確認しました。
Rは、64ビットのUbuntuのインスタンス上で実行されている、とhttps://stackoverflow.com/a/18091755/ごとに私は.Machine$sizeof.pointer
をチェックし、(私はそれは私が64ビットでRを実行しているを示していると考えている)8
を得ました。
エラーメッセージに、入力ファイルに空の行があり、その行が停止していると表示されています。それは事実ですか?あなたの入力に空白行があると思いますか? – MrFlick
良い質問です。それは否定的です。ファイルに空白行がないことを確認しました。 – user5568265
'blank.lines.skip = TRUE'を試してみてください。 –