文字列から最初の文を切り詰めるという問題に苦労しています。 ドットで終わった略語がないと、それほど問題はありません。Pythonでの正規表現の使用
だから私の例は次のとおりです。
- 文字列=「私はチーズ、車などが、私の最も好きなウェブサイトはstackoverflowのですね。私の新しい馬はランディと呼ばれています。
そして、その結果は次のようになります。
- 結果は=「私はチーズ、車などが、私の最も好きなウェブサイトはstackoverflowのですね。」
通常、私がどうなる:
re.findall(r'^(\s*.*?\s*)(?:\.|$)', event)
が、上記など
を言及したように、私は、いくつかの事前定義された単語をスキップしたい私はのカップルとなりましたそれらのどれも働かなかった。
http://stackoverflow.com/a/1732454/203705:ソースコードから
:でそれをロードします。 あなたは本当に何をしようとしていますか?あなたが解決しようとしているより大きな問題は何ですか? –
私はいくつかのイベントリファレンスを持つ文字列を持っており、私はこのイベントの略語を作成しています。私が知っているように、基本情報は最初の文章の中にイベントの名前がありますが、時にはインターンのような略語が使われることもあります。 =国際的なものなど、これは本当にお尻に痛みを伴うことがあります。 – skornos
私は最後にTony the Ponyのリンクを投稿しました。[tchrist](http://stackoverflow.com/users/471272/tchrist)は木工から出てきて、私を提出するように言いました。とにかく、制約はありますか、または任意の英語の文章について話していますか?あなたが定義した単語のリスト( 'etc.'を含む)が文の終わりに決して現れない、あるいは文が常に大文字と'の後ろの単語で始まると言うことができるなら、役に立つでしょう。 '決してしない。 – cha0site