次のコード行の正規表現が何を意味しているのか理解できません。rのsubとgsubの正規表現の解析
author = "10_1 A Kumar; Ahmed Hemani ; Johnny Öberg<"
# after some experiment, it looks like this line captures whatever is in
# front of the underscore.
authodid = sub("_.*","",author)
# this line extracts the number after the underscore, but I don't know
# how this is achieved
paperno <- sub(".*_(\\w*)\\s.*", "\\1", author)
# this line extracts the string after the numbers
# I also have no idea how this is achieved through the code
coauthor <- gsub("<","",sub("^.*?\\s","", author))
私は、第1引数がパターンであり、第2引数が置換であり、第3パラメータが操作対象であることをウェブから読み取っています。私はまた、SOのいくつかの投稿を見て、\\w
が単語を意味し、\\s
がスペースであることを知った。
しかし、いくつかのことはまだ不明です。 \\w
は単語を意味し、次の単語を意味しますか?そうでない場合は、どのように解釈すればよいですか?私は^
が文字列の先頭と一致することを知りましたが、^
の後の期間はどうですか?
さらに重要なことは、_.*
の解釈は何ですか.*_
について^.*?\\s
はどうですか?どうすればそれらを読むべきですか?
ありがとうございます!
ここにあるものhttps://regex101.com – rawr
@rawrどのような味を選ぶべきですか?それらのすべてがエラーを表示するようです。 – Waht
[pcreはうまくいくはずです](https://regex101.com/r/sIb7Ql/1)、私はエラーを表示しません。このウェブサイトを使用しているときには二重\が必要ではありません。 – rawr