Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, :
line xxx did not have yyy elements
を
read.csv()
はエラーなしで同じファイルで完全に動作します。私はまたread.csv()
の速度もread.table()
より高いと思います。
さらに:read.table()
は私のファイルを非常にクレイジーに読んでいます。このエラーは、行100を読み込んでいるときに発生しますが、同じファイルの先頭の直後に行90〜110をコピー&ペーストすると、行100 + 21(最初にコピーされた新しい行)のエラーになります。その行に問題がある場合、最初に貼り付けられた行を読み取っている間にそのエラーを報告しないのはなぜですか?私はread.csv()
がエラーなしで同じファイルを読み込むことを確認します。
read.table()
は、read.csv()
と同じファイルを読み取ることができない理由がありますか?いずれにしてもread.table()
を使用する理由はありますか?
はまた、読み取りなかった(これは
read.table
周りだけ薄いラッパーですが、それは適切な値にオプションを設定します)メモリ使用量の 'read.table()'のヘルプページは、なぜ大容量のファイルでは遅く見えるかもしれないのかを示しています。 – Chase再現可能な例がなくても(更新された)質問に答えることはできません。最も一般的な読み込みの問題は、(1)検出されなかったコメント文字、(2)不一致の引用符、(3) 'fill = TRUE'のときにファイルの最初の5行の後の1行あたりのフィールド数の変化です。 'read.csv'と' read.table'は 'comment'、' quote'、 'fill'のデフォルト値が違うので、これらのいずれかが問題になる可能性があります。 –
PSには、 'comment' /' quote'/'fill'の8つの組み合わせがあります。それらをすべて試して結果がどのように違うのか見ることができます。 'count.fields()'は診断にも便利です。 –