特殊ユーロ文字

私は特別な€文字が含まれているように思われる文字列があります。特殊ユーロ文字

my_str         # [1] "0€ de frais de courtage" 
my_str == "0€ de frais de courtage"  # [1] FALSE 
gsub("€","X",my_str)      # [1] "0€ de frais de courtage" 
gsub("€","X","0€ de frais de courtage") # [1] "0X de frais de courtage"

私はつまり、私はAlt-gr + Eで入力することができます一つの標準€文字でそれを置き換えるしたいと思いますが。

これらの文字列は、ファイル名から来た私は、私はこれを行うことができますどのようにlist.files

を得ましたか。

EDIT：

utf8ToInt(my_str) 
# [1] 48 8364 32 100 101 32 102 114 97 105 115 32 100 101 32 99 111 117 114 116 97 103 101 
utf8ToInt(stringi::stri_enc_toutf8("0€ de frais de courtage")) 
# [1] 48 128 32 100 101 32 102 114 97 105 115 32 100 101 32 99 111 117 114 116 97 103 101

出典

2017-09-05 Moody_Mudskipper

「Alt Gr + E」が「編集」を開くと混乱します。また、 'gsub（"€ "、" X "、my_str）'と '' gsub（ "€"、 "X"、 "0"は異なる結果を与える）の理由は異なるでしょうか？「X」とは何ですか？ – Sotos

私のキーボード上では、 'Alt gr + E'で'€ '記号が得られますが、これはヨーロッパでのみ可能です。 '' X ''は何が間違っているのかを示すランダムな文字であり、なぜ同じ結果が得られないのかは私が疑問に思っているものです。それは明確ですか？ –

あなたの 'my_str =="コマンドラインを貼り付けてコピーすると、あなたのキーボードにAltGR + Eを使った場合と同じ文字が表示されます：U + 20AC。違いは、stackoverflowに投稿するときに失われた可能性があります別の表現（ユニコード、または生の16進数）を投稿しようとする必要があります – Aaron

文字列が同一に見えるが€文字が異なっています。私たちが面倒€のコードは8364ている間、通常の€のコードが128であることがわかりポストの下部にある私のEDITで

。

と十分に確認してください：

gsub(intToUtf8(8364),"X",my_str) # [1] "0X de frais de courtage"

だから私が探していたソリューションです：

gsub(intToUtf8(8364),"€",my_str)

それは "通常の" 128azerty alt gr + E€シンボルと "間違っている" €文字を置き換えます。

出典

2017-09-05 14:26:17

答えて

関連する問題