2017-02-18 8 views
0

私はデータのいくつかの列にフォーマットを与える必要がある、乱雑なデータベースで作業しています。このために、私は多くのGSubと他の形式の正規表現を使用します。私の問題は、私がきれいにする必要があるキャラクターのいくつかは、 "奇妙な"キャラクター、特に上記のカーリーのものが続き、他の奇妙なキャラクター(Ã ')が続きます。RStudio - 奇妙な文字が普通の文字になる

私はGSUB機能上のデータベースからコピーして貼り付けます。

gsub("CALLÑE", "CALLE", data)

enter image description here

私は閉じてRStudioと、それを再度開くまで、それは正常に動作します。その後、文字はRScriptファイルで異なります。それは彼らが再び開かれたときにRStudioが変な文字自体をサポートしていませんでしたかのようで、スクリプトからそれらを削除します。

gsub("CALLÃ'E", "CALLE", data)

enter image description here

がどのように私はこれを避けることができますか?ファイルを閉じた後でも私の奇妙な文字を保持します。 RStudioで

+0

[this](http://stackoverflow.com/a/34317869/3079302)が役立つかどうかを確認してください。 PS:訂正を行うために質問を編集するときに、文脈を提供しない場合や、質問自体を変更しない場合は、間違っていたものを削除することもできます。 – iled

+0

簡単にするために、私はこれをやっています:(1)ベクトル<-c( 'CALL'E')(2)エンコーディング(ベクトル)< - 'latin1' –

+0

なぜラテン文字以外の文字を保持したいのですか? – Elin

答えて

2

Fileに行く - >Save with Encoding...

UTF-8オプションを選択します。