コンパイル済みの正規表現を使用してリスト内のすべての単語を一致させて削除しようとしていますが、単語内での出現を避けるために苦労しています。でPythonリストから文字列内の単語をすべて削除します
REMOVE_LIST = ["a", "an", "as", "at", ...]
remove = '|'.join(REMOVE_LIST)
regex = re.compile(r'('+remove+')', flags=re.IGNORECASE)
out = regex.sub("", text)
:が出
を "速い茶色のキツネがアリを飛び越えた":
現在期待
を "速い茶色のキツネは、トンを飛び越えた":"クイックブラウンキツネが飛び越えた"
私はにコンパイルする文字列を変更しようとした以下のが、無駄に:
regex = re.compile(r'\b('+remove+')\b', flags=re.IGNORECASE)
任意の提案や、私は派手明らかに何かが足りないのですか?
おそらく 'ant'はあなたの一部です。リストを削除しますか? –