[％〜abcd〜％]の間にPython正規表現がコンテンツを削除できません

生のHTMLがあり、この[％〜as..abcd〜％]のようなブロック全体を出力文字列から削除しようとしています。 Pythonのライブラリを再利用する[％〜abcd〜％]の間にPython正規表現がコンテンツを削除できません

teststring = "Check the direction . [%~ MACRO wdwDate(date) BLOCK; 
       SET tmpdate = date.clone(); 
       END ~%] Determine if both directions." 
cleanM = re.compile('\[\%\~ .*? \~\%\]') 
scleantext = re.sub(cleanM,'', teststring)

コードで何が間違っていますか？

出典

2017-12-01 pushkar rawat

デフォルトでは、 '.'は改行文字と一致しません。あなたは 're.DOTALL'フラグを使わなければなりません。 '％'、 ']'、 '〜'は特殊文字ではないので、エスケープする必要はありません。パターンのコンパイル時には、最後の行は次のようになります： 'scleantext = cleanM.sub（ ''、teststring）' –

'％'、 ']'、 '〜' –

あなたのパターンは

cleanM = re.compile(r'\[\%\~ .*? \~\%\]',re.S)

.は改行以外の任意の文字に一致しなければなりません、Sは

出典

2017-12-01 11:24:25 mkHun

re.Sを使用する場合は、 're.compile'を使用する必要があります。 – mrCarnivore

マーカをマッチから除外することもできます： 'r '（？<= \ [％〜）。*（？= \〜％]）' ' 。 BTW：正規表現には常に生の文字列（ 'r '...''）を使用してください。 –

があなたの代わりに.*の[\S\s]*を使用する必要が改行に一致させることができます、あなたは、コンパイルを残すことができます：

import re 
teststring = '''Check the direction . [%~ MACRO wdwDate(date) BLOCK; 
       SET tmpdate = date.clone(); 
       END ~%] Determine if both directions.''' 
scleantext = re.sub('(\[%~ [\S\s]* ~%\])', '', teststring) 

print(scleantext)

出典

2017-12-01 11:27:25 mrCarnivore

[％〜abcd〜％]の間にPython正規表現がコンテンツを削除できません

答えて

関連する問題