私は正規表現を単語と単語の範囲で指定します。例えば正規表現を作成して少なくとも所定の間隔を認識させる
:
pattern = 'word \\w+ \\w+ \\w+"
result = [text[match.start():match.end()] for match in re.finditer(pattern, text)]
区間でも、それを認識することの要素の数が少ないがある場合になるようにどのように正規表現を修正するだろうか?たとえば、単語が文字列の最後にある場合は、その間隔も返すようにしたいと思います。
可能な限り、可能な限り大きなパターンを返すようにしてください。
入力例を入力して一致/出力したいものがあれば、非常に役に立ちます。 – Vallentin
これは '\\ w +'を3回探すことを意味しますか?それをどのように変更して3つ以下を見つけるか?何を試しましたか? – doctorlove
're.findall(r :(?:\ s + \ w +){0,3} '、s)' –