異常なシンボルが含まれているファイルからデータを読み込めません。エラーメッセージは表示されませんが、特定のシンボルを含む行にヒットすると停止します。 ; - ">" シンボルですR Windowsのシンボルでファイルを読む
Familial Non-VHL Clear Cell Renal Cancer;Birt-Hogg-Dub-> Syndrome
しかし:
temp = read.csv(filePaths[i], header=TRUE, sep="\t", comment.char="#")
に読み込まれる最後のフィールドには、これは実際に読み込み、Excelでファイルを読み込み
Familial Non-VHL Clear Cell Renal Cancer;Birt-Hogg-Dub
です私はこれが実際に "Birt-Hogg-Dubé症候群"だと信じています。最後の文字はおそらくEOF charと解釈されています。
私はWindowsでこの問題が発生しています。
別のエンコーディング(encoding = "UTF-8"とencoding = "bytes"、fileEncoding = "UTF-8")を使用してみました。私はCannot read unicode .csv into Rを見て検索しましたが、簡単に答えを見つけることはできません。私はおそらく特定の言語エンコーディングを使用することはできないことに注意してください。ありがとう!
- 更新 - はこちらをご覧1列、ヘッダ、3つのエントリ(#2で問題のエントリ)でファイル作成:、あなたを変更するには、あなたが推測してきたように https://www.dropbox.com/s/3m2wak8rhyab6j2/test.txt?dl=0
を経由して、そのファイルのエンコーディングを指定するあなたはあなたの問題が再現可能にするために、ファイル(またはその関連部分)を投稿することができますを決定? – lukeA
ちょっとお世話になりました! –
私は参照してください。 '\ 032'は問題を作り出しています。 'download.file(" https://www.dropbox.com/s/3m2wak8rhyab6j2/test.txt?dl=1 "、tf < - tempfile(fileext =" .csv "));ライブラリ(stringi);読み込み。 csv(text = stri_read_lines(tf)、header = T) 'がロードされます。 – lukeA