2017-11-10 16 views
1

"CHAIRMAN"という単語と最後のピリオド "。"の間のテキストを抽出します。 "CHAIRMAN"と "。"を含むテキストに記載されています。私は次の文字ベクトルを持っています: "椅子の大量のテキスト。"正規表現を使用してテキストを抽出する

"CHAIRMAN"と "。"テキストで何回も言及されていますが、私は最初に "CHAIRMAN"が使用されてから最後の期間 "。"までのテキストを抽出したいだけです。使用されている。私は正規表現を使いたいです。

ありがとうございました。

答えて

2

あなたはちょうど次の手順を実行することができますので、貪欲にsub

TEXT = "CHAIRMAN massive amount of text." 
sub(".*?(CHAIRMAN.*\\.).*", "\\1", TEXT) 
[1] "CHAIRMAN massive amount of text." 
+0

。私はちょうど "間"の部分を読んだ。答えを変える。 – G5W

2

.+.*との両方が一致することをを行うことができます:あなたは正しいです@user

string = "The CHAIRMAN massive amount of text. CHAIRMAN massive amount of text. This is just a place holder" 

stringr::str_extract(string, "CHAIRMAN.+\\.") 

# [1] "CHAIRMAN massive amount of text. CHAIRMAN massive amount of text." 
関連する問題