2017-04-04 12 views
0

文字ベクトル内のすべてのエントリの文字をトリミングする方法を理解する必要があります。私は検索し、ベクトルを参照するとき^を使用しようとしましたが、それは働いていません。私は気づいていない、これを行う簡単な方法があると確信しています。Rベクトル内のアイテムの文字を切り取る

例:文字ベクトルCVの

CV <- c("ABC_001", "ABC_002", "DEF_003", "DEF_004", "GHIJKLM_005", "GHIJKLM_006") 

希望の形式:

"ABC","ABC","DEF","DEF","GHIJKLM","GHIJKLM" 

あなたの助けをありがとう!

+1

'ライブラリ(stringr)'と 'str_extract(CV、 "[A-Z] *")'。 'str_extract(CV、" [a-zA-Z] * ")' –

+2

アンダースコアから 'sub(" _。* "、" "、CV)' –

+0

@RichScrivenを削除してください。重複 - おそらくhttp://stackoverflow.com/questions/17187552/removing-everything-after-first-backslash-in-a-stringが十分に近いですか? – thelatemail

答えて

2

gsub("[^A-Z]", "", CV)

https://regex101.com/ 私は正規表現をテストするため、このウェブサイトは非常に役に立ちました。がんばろう!

1

この特定の例では、の文字列にアンダースコアを使用してさらに分割したいと思うようです。その場合は、あなたはstrsplitを使用することができます。

sapply (strsplit (CV, split = "_"), "[", 1) 
関連する問題