データフレーム列の一連の個々の名前に対していくつかのデータクリーニングを実行しています。それぞれの名前の末尾に非アルファベット文字を削除したいと思います。上記の場合文字列の末尾から複数のアルファ以外の文字を削除する
countries <- c("Senegal1345769", "Canada&", "Austria12", "Spain-", "Russia#$")
、私はに国をオンにしたいと思います:私は、文字の特定のパターン(例えば、pattern = ",$"
)でgsub()
を使用することができ
[1] "Senegal" "Canada" "Austria" "Spain" "Russia"
が、私はどのように非常にわからないんだけど末尾の非アルファ(例えば、"Senegal1345769"
)が複数ある文字列に対してこれを行います。
この問題に対処するためにどのようなパターンを使用しますか?
'gsub(" [^ [:alpha:]] * $ "、" "、countries)'を試すことができます。 – Scarabee
'(?i)[^ a-z] + $'しかし、これはアルファベットをチェックしないことに注意してください。 – sln
私はこれがうまくいくと思います、@ d.b!みんな、ありがとう。それは有り難いです。クイックサイドの質問:最初に「[^:alpha:] + $」を使用しました。なぜこれは機能しませんでしたか?ちょうどそれが何がうまくいかなかったのかのより良い感覚を得ることを試みる。 –