2017-02-09 15 views
2

私は特定の特殊文字といくつかのジャンクを '& quot'のように削除したいと思っています(ただし、 'é'、 'á'などの特殊文字は残しておきたい)。 EXACTパターン '& quot('は '&'を別途削除できます)をどのように一致させることができますか?Python regexp正確な単語を見つけよう

word = re.sub('[,|;|?|!|(|)|{|}|.|&|\bquot\b]+', '', word) 

私はこれを実行していますが、すべての 'q''u''o''t'文字を削除します。要求されたよう

EDIT テスト文字列:

'&quottermészet&quot' should be 'természet'  
'data,' should be 'data' 
+0

はテスト文字列と期待される出力を提供し、この正規表現を試してみてください。 – MYGz

答えて

1

あなたはこのような何かを意味ですか?

re.sub('&quot', '', "abc&quotdef") 
+0

ええ、ええ、でも、これをどのように '' [、| | | |(|)| {|} |。] + '' という表現に加えることができますか? –

+0

なぜ2行のコードを書くのですか? – ergonaut

2

大括弧で囲んだ場合は、|

セパレータは

re.sub(r'[,;?!(){}.]|\&quot', '', word) 
+0

're [r '[、;?{!}}} + |&quot'、 ''、word)'を使うと空の文字列にマッチして置き換える必要はありません。 –

+0

はい、空の文字列に一致するのを避けるのが良いです。私は私の答えを編集します – Andrea

関連する問題