2017-06-24 2 views
0

小さなテキストのリストがあります。 エンディングの一部のテキストには、スペースで区切られた一連の数字が含まれている場合があります。そのような場合には、このシーケンスの最初の番号をテキストに残して、残りの数字列を切り捨てる必要があります。どうやってするの? 例:Rの正規表現:数字の順序を切り取る方法は?

  1. "いくつかの単語1" - > "いくつかの単語1"
  2. "いくつかの単語" - > "いくつかの単語"
  3. "いくつか1単語2" - >「いくつか1ワード2 "
  4. "いくつか1つのワード3 33 444" - > "いくつか1語3"
  5. "いくつかの単語544 11 - 以下のパターンを有するいくつかの単語544 "

答えて

3

使用gsub()">"

(\\d+)(?: \\d+)*$ 

次に、最初のキャプチャグループ(\\1)に置き換えてください。ここ

x1 <- "Some words" 
x2 <- "Some words 544 11" 
x3 <- "Some 1 words 3 33 444" 
result1 <- gsub("(\\d+)(?: \\d+)*$", "\\1", x1) 
result2 <- gsub("(\\d+)(?: \\d+)*$", "\\1", x2) 
result3 <- gsub("(\\d+)(?: \\d+)*$", "\\1", x3) 

print(result1) 
print(result2) 
print(result3) 

デモ:

Rextester

関連する問題