大量のcsvファイル(17m行)をRにインポートする際に問題があります。readr::read_csv
とdata.table::fread
の両方を使用しようとしましたが、 。これは、列の1つにコンマを含むテキストが含まれているためです。 readLines
でファイルを読むと、テキスト内のカンマの前に二重バックスラッシュが付いているので無視する必要がありますが、いずれのパッケージも無視することはできません。 例は次のようになります。R大容量のcsvをコンマで読み込み、readrまたはdata.tableにダブルバックスラッシュ付き
id,title
1,great expectations
2,great expectations\\, the sequel
データのいくつかの行を含めてください –
どのようなソフトウェアがこの無効なファイルを作成しましたか? –