Windows 7 64ビット版でR 2.15.0を使用しています。私はunicode(CJK)テキストをファイルに出力したいと思います。UTF-8ファイル出力:R
次のコードは、Unicode文字のように動作しないUTF-8ファイル接続上の書き込みに送られた方法を示し予想(I):
Read 1 item
[1] "<U+5728>"
:
rty <- file("test.txt",encoding="UTF-8")
write("在", file=rty)
close(rty)
rty <- file("test.txt",encoding="UTF-8")
scan(rty,what=character())
close(rty)
スキャンの出力で示されているように
ファイルはUTF文字自体ではなく、ANSI準拠のフォールバックなどの形式で書き込まれています。最初に正しく動作させることができますか(代わりに「在」というテキストファイルを使用しています)、またはコード文字列を置き換える適切な文字で出力をUnicodeに変換するために余分な魔法を働かせることはできますか?
ありがとうございました。
[詳細情報:同じコードがを正しく実行します。Win7の2.14.2も、Cygwin、R 2.14.2ではが壊れています。これはどこかで私の端にある?]
[最新の更新]問題は、エンコードではなく*ロケール*である傾向があります。ロケールを一時的に「適切なもの」に変更することで、不安定な出力問題を解決しました。複数のロケールからの言語データがある場合、神はあなたを助けます。 – Patrick
多分この[投稿](http://stackoverflow.com/questions/11069908/r-extracting-clean-utf-8-text-from-a-web-page-scraped-with-rcurl?lq=1)助けて。 – DJJ