readrパッケージを使用して大きなファイル(2000000行近く)を読み込む問題があります。異なる行の長さと空白を区切り文字とする大きなデータファイルを読み込むためにreadrを使用する
なぜ読者パッケージを使用したいのですか?私のデータファイルには、read.table()
の実行を停止するASCII制御文字(ascii 26と等しいascii 26に等しい)が入っていて、readr
パッケージはその問題に影響されないことに注意してください。
ファイルの行数が異なるため、read.table()
を使用できる場合はfill=TRUE
を使用します。
読者パッケージのread_table
を使用しようとしましたが、空白が列セパレータとして見つからないようですが、成功しませんでした。
read_delim
を使用しようとしました。コードはread_delim(file,delim=" ")
です。セパレータが見つかりましたが、最初の行がデータフレームの主な長さとみなされ、したがって、行の長さが切り捨てられました。
誰にでもアドバイスがありますか?
私は、次のコードを使用して、データフレーム(rtcm1)に(ファイルという名前のファイルから)私のデータを集めることに成功し
'fread'関数' data.table'を試しましたか? – Jaap
あなたは 'read_file()'を使ってどのように試してみましたか?この関数は、[列が空白で区切られたテキストファイルを読む](http://search.r-project.org/library/readr/html/read_table.html)に正確に作成されました。代替案を考えると、各列の「幅」は分かりますか?列の最初と最後の位置? –
私はちょうどfreadを試してみましたが、空の行で停止したようですが、そのエラーを止めるための手がかりはありますか? –