2012-03-13 11 views
1

read.table()コマンドを使用してスカンジナビア文字を含むデータをコンマで区切った値ファイルをrのデータフレームに読み込もうとすると、正しく出力されません。つまり、 "å"、 "æ"、 "ø"、 "ä"、 "ö"などの文字が正しく含まれています。今では、アルファベット以外の記号で表されており、プロットなどのその他の疑問を訴えることがよくあります。スカンジナビア文字を正しくデータフレームに読み込む

私はthe ordinary text editor in OS Xに私のCSV-ファイルを保存するんだけど、私はまた、このようなUTF-8とUTF-16として、特定の形式で自分のファイルを保存し、TextWranglerを使用してみましたし、その後read.table()コマンド内で私のエンコーディングを指定しました"encoding="オプションを使用してください。

スカンジナビア語の文字がCSVファイルからデータフレームにインポートされる最小限の例は次のようなものですか?

答えて

4

ロケールに関する詳細を含める必要があります。サンプルを入手できる場所にサンプルを置く必要があります。現時点では私のMacは(と私はそれをしても必要なのロケールではないよ)文字を正しく読んでいるように見える:

> read.table(text='"å", "æ", "ø", "ä"', sep=",") 
    V1 V2 V3 V4 
1 å æ ø ä 
> Sys.getlocale() 
[1] "en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8" 

(私もTextEdit.appでファイルを作り、それはまた、適切で読み込みます。そして彼らはプロットに正しく表示)あなたはファイル・エンコーディングパラメータを入力エンコーディングを指定しようとすることができます:。

> read.table(text='"å", "æ", "ø", "ä"', sep=",", fileEncoding="UTF-8") 
    V1 V2 V3 V4 
1 å æ ø ä 

...私のために何もしませんが、これはあなたのロケールがC」として設定された可能性がある場合"これはMacを持っている人には正当な理由がないと思われる。 read.tableに 'encoding'パラメータのみを使用すると、入力ステージでは何も行われませんが、読み取り操作の結果に属性が割り当てられます。

関連する問題