正規表現：特定の文字列ではないシーケンスと一致する

s = 'blah blah blah... _ABC_superman_is_cool_CBA_ ...blah blah blah...'

これは単なる例ですが、_ABC_と_CBA_の間のすべてを一致させたいと思います。だから 'superman_is_cool'。 _ABC _..._ CBA_の複数のセクションがあります。正規表現：特定の文字列ではないシーケンスと一致する

re.findall('_ABC_(.*)(?=_CBA_)', s)

私はこれを最初に試みましたが、明らかに正しく動作しません。

>>> s = 'blah blah blah... _ABC_superman_is_cool_CBA_ ...blah blah _ABC_blah_CBA_...' 
>>> re.findall('_ABC_(.*?)_CBA_', s) 
['superman_is_cool', 'blah']

?が、それはよう見つけたので*オペレータ非貪欲になります：

出典

2011-01-09 jairajs89

は、私はそれがすべての一致が見つかったことを確認するために、追加_ABC_、_CBA_ペアを追加してみてくださいできるだけ短いマッチ。それがなければ結果は['superman_is_cool_CBA_ ...blah blah _ABC_blah']になります。

出典

2011-01-09 06:56:28

+1は貪欲によって噛まれていません;） – delnan

Perfect！ありがとう。 – jairajs89

この

re.findall('_ABC_.*_CBA_)', s)

出典

2011-01-09 06:53:44 Falmarri

これは有効な正規表現ではありません。 – jairajs89

正規表現：特定の文字列ではないシーケンスと一致する

答えて

関連する問題