2016-03-20 9 views
1

異常なシンボルが含まれているファイルからデータを読み込めません。エラーメッセージは表示されませんが、特定のシンボルを含む行にヒットすると停止します。 ; - ">" シンボルですR Windowsのシンボルでファイルを読む

Familial Non-VHL Clear Cell Renal Cancer;Birt-Hogg-Dub-> Syndrome 

しかし:

temp = read.csv(filePaths[i], header=TRUE, sep="\t", comment.char="#") 

に読み込まれる最後のフィールドには、これは実際に読み込み、Excelでファイルを読み込み

Familial Non-VHL Clear Cell Renal Cancer;Birt-Hogg-Dub 

です私はこれが実際に "Birt-Hogg-Dubé症候群"だと信じています。最後の文字はおそらくEOF charと解釈されています。

私はWindowsでこの問題が発生しています。

別のエンコーディング(encoding = "UTF-8"とencoding = "bytes"、fileEncoding = "UTF-8")を使用してみました。私はCannot read unicode .csv into Rを見て検索しましたが、簡単に答えを見つけることはできません。私はおそらく特定の言語エンコーディングを使用することはできないことに注意してください。ありがとう!

- 更新 - はこちらをご覧1列、ヘッダ、3つのエントリ(#2で問題のエントリ)でファイル作成:、あなたを変更するには、あなたが推測してきたように https://www.dropbox.com/s/3m2wak8rhyab6j2/test.txt?dl=0

+0

を経由して、そのファイルのエンコーディングを指定するあなたはあなたの問題が再現可能にするために、ファイル(またはその関連部分)を投稿することができますを決定? – lukeA

+0

ちょっとお世話になりました! –

+1

私は参照してください。 '\ 032'は問題を作り出しています。 'download.file(" https://www.dropbox.com/s/3m2wak8rhyab6j2/test.txt?dl=1 "、tf < - tempfile(fileext =" .csv "));ライブラリ(stringi);読み込み。 csv(text = stri_read_lines(tf)、header = T) 'がロードされます。 – lukeA

答えて

0

が必要あなたのファイルを読むときのファイルエンコーディング。

  1. どのファイルのエンコーディングyou have

  2. 使用read.tablefileEncoding

+0

ありがとうございました、提案を介して、私はメモ帳を使用し、エンコーディングが "ANSI" 。私はfileEncoding = "ANSI"を試してみましたが、 "サポートされていない変換を 'ANSI'から ''に変更しましたが、ファイルを" ANSI "から" UTF-8 "に変更しようとしましたが、fileEncoding = UTF-8 " –

+0

メモ帳で開いたときに、正しく表示されたのですか? – csgillespie

+0

はい、それは意味のあるすべてのデータを表示します。 –