データを削除するには=私は正規表現は、Pythonで文字と数字の孤立出現を何度
を 「私たちの96 35の研究室がAAAAカナマイシンを追加ポンドの43 65 66 43リットルほどを準備する中、様々な人々」のようなデータを持っています私は「私たちの研究室では、様々な人々が43リットルを準備したりポンドのようになるカナマイシンを追加する」のようにそれを印刷したい
注意してください:43リットルを削除すべきではありません。それは数の後のテキストを持っているので、それは孤立していないからです。
は、私は、以下の方法を使用してみました: -data = re.sub('\s[a-z]\s', ' ', data)
data = re.sub('\s[a-z]\s', ' ', data)
data = re.sub('\s[a-z]\s', ' ', data)
data = re.sub('\s[a-z]\s', ' ', data)
分離4を削除するには「」私は、同じタスクを4回行う必要があります。孤立した数字も同じです。
もっと良い正規表現のバージョンが同じことを行うことができますか?
私が欲しい(例えばA、I)と純粋な数字(例:23、95)あなたは –
すべての孤立した文字を削除したいテキストを記述したルールのセットを提供してください削除する。問題は、私は最初に文字で試しているが、私の正規表現は、一回のパスで 'a'の1つだけのオカレンスを削除し、残りの部分は変更しません。そのような孤立した「a」の出現をすべて1つのパスで削除したい –
これを行うためのより正確な方法があります:{'\ b(?:\ d + \ b \ s |([az] + \ s +)\ '](https://regex101.com/r/M40Lie/2) – revo