2017-02-09 10 views
-1

私はこの 蜂巣に私を導く正規表現 私の以前の試み文字列から記号、数字、スペースをすべて削除するにはどうすればよいですか?

s= re.sub(r"(\b|\s+\-?|^\-?)(\d+\s[-]\s|\d*\.\d+)\b","",s) 

を使用してpythonで

CELLULITISWOMCC 

に変換したいこの

603 - CELLULITIS W/O MCC 

のような文字列を持っていますW/O MCC

+0

何か試しましたか?おそらくあなたが持っている場合は、質問にそれを含めることができます。 – MYGz

+0

文字ではないものに対しては正規表現を作成し、空文字列に置き換えます。あなたはまだ正規表現を使用しましたか? – gunr2171

+2

SOがコーディングサービスではないため、この質問を議論の対象外としています。 – TigerhawkT3

答えて

2

大文字でない文字を削除したいので、否定正規表現は正の正規表現よりもはるかに優れています。大文字アルファベットではない文字を検索し、空の文字列で置き換えます。

あなたはそうのようにしてみてください可能性があります

import re 

s1 = "603 - CELLULITIS W/O MCC " 
s2 = re.sub(r'[^A-Z]+', r'', s1) 
print s2 

出力:

CELLULITISWOMCC 

正規表現:

[^A-Z]+からAからZ

にはないマッチ1文字以上デモ:https://regex101.com/r/OCNztP/1

関連する問題