5
ユニコードを中国語の文字に変換するためのスクリプトを作成しました。temp.df[,"name_unicode"]
の最後の文字列は "§£"(引用符なし)で、中国語を知らない人も役に立ちます。ユニコードの変換とエクスポートR
library(RODBC)
library(Unicode)
temp.df <- data.frame(name_unicode=c("陳大文",
"陳小敏",
"陳一山",
"§®£"),
stringsAsFactors=FALSE)
temp.df[,"name_unicode_mod"] <- sapply(temp.df[,"name_unicode"],
function(x) {
temp <- unlist(strsplit(x,";"))
temp <- sprintf("%x",as.integer(gsub("[^0-9]","",temp)))
temp <- intToUtf8(as.u_char_range(temp))
return(temp)
})
write.csv(temp.df,file("test.csv",encoding="UTF-8"),row.names=FALSE)
temp.df[,"name_unicode_mod"]
の出力には、RコンソールのOKです。しかし、私はcsv
またはxls
形式でそれらをエクスポートする必要があります。私はwrite.csv
、write.table
、odbcConnectExcel
をRODBC
に入れましたが、どれも<U+00A7><U+00AE><U+00A3>
のようなものです。
誰でも手助けできますか?ありがとう。
P.S.私はR 3.0.0とWin7を使用しています
'write.table'関数の' encoding'引数も使ってみましたか? –
試みました: 'out < - file(" test.txt "、" w "、encoding =" UTF-8 "); write.table(temp.df、out、row.names = FALSE); close(out) ' がまだ失敗する – lokheart
+1私はエンコーディングであなたの苦痛を感じます。 –