Pythonで正規表現を使用して特殊文字列を含む文字を削除するにはどうすればよいですか?
例私は、ログをクリーンアップしようとしていると私はいくつかの特別な文字列を削除する:
%/h > %/h Current value over threshold value
Pg/S > Pg/S Current value over threshold value
Pg/S > Pg/S No. of pages paged in exceeds threshold
MB < MB min. avg. value over threshold value
を私はいくつかのパターンを使用しようとしましたが、動作しないようです。
re.sub(r'\w\w\/\s>\s\w','',text)
私は特別なパターンを削除するための良いアイデアはありますか?
私は唯一の私の出力は便利な言葉が含まれている期待.../...> .../...
を削除したいです。
Current value over threshold value
No. of pages paged in exceeds threshold
min. avg. value over threshold value
ありがとうございました!
は '>'常に同じ前と後のコンテンツですか?一致する '^([^ \ s>] *)\ s +> \ s + \ 1'は私の考えです。 –
それはいつもそのように間隔を置くつもりですか?言い換えれば、興味のある文字列は常に第3のスペースの後になるだろうか? – idjaw