1
私はすべてのパターンを抽出し、次のプログラムを書きました(可能ハイフン付きの単語、句読点)抽出言葉
sentence="Narrow-minded people are happy although it's cold ! I'm also happy"
print(re.split('([^-\w])',sentence))
結果は次のとおりです。
['Narrow-minded', ' ', 'people', ' ', 'are', ' ', 'happy', ' ', 'although', ' ', 'it', "'", 's', ' ', 'cold', ' ', '', '!', '', ' ', 'I', "'", 'm', ' ', 'also', ' ', 'happy']
質問です単語の終わりにアポストロフィを考慮する(追加する)方法。たとえば、の代わりに"it'"
を検索したいとします。
althou gh ''と ''だけではなく ''があります。 – Hana
@ハナ詳細を提供するために答えを更新しました。元の出力に感嘆符の周りに空の文字列( '' '')が既に含まれていたことを考えれば、それ以上は持っているのは問題ではないと思った。 – ebo
例外を入れるために式を改善するにはどうすればよいですか?(再適用したくない2つの特別な単語(O'Neillなど) – Hana