再使用して実際の文章を取得し、最初の文章はいつもの場所で始まるようにPythonはニュース記事に最初の文を分割し、ほとんどのニュース記事について
クアラルンプールとして、ハイフンまたはカンマで次のとマレーシアは月曜日、 キムジョンウンの兄弟の殺害に関する調査を行った。 の映像がクアラで致命的に攻撃された瞬間に現れた ルンプール空港。
、メイン州ポートランド - FairPointコミュニケーションズはスカボロー、ゴーハム、ウォーターヴィル、ケネバンクケープ エリザベスの規制固定電話 サービスの新規顧客の申し込み停止する 許可を規制当局を求めています。
私は月曜日に、このような
北朝鮮、マレーシアとして、主文で後半を分離するために再使用しようとしていますがリーダーキムの殺害に 捜査上の角をロックチョン・ウンの兄弟は、 の映像がクアラで致命的に襲われた瞬間を浮き彫りにした。 ルンプール空港。
しかし、これはすべてのために動作しない第2文の結果は次のとおりです:私はそれらを分離するために、次のregrexを使用sep = re.split('-|:|--', sent)
Portland、メイン '[
\ xe2 \ x80 \ x94フェアポイント・コミュニケーションズは、 スカーバラ、ゴーハム、ウォータービルの規制付き固定電話サービスの新規顧客の登録を停止する許可を 規制当局に依頼しました Kennebunk and Capeエリザベス。]
ユニコードと関連がありますか?または、再コードで異なる形式のハイフンを渡す必要がありますか?
これを普及させる普遍的な方法はありますか?
ありがとうございました。
区切り文字は 'であることが必要である '-''、なぜあなたは'に分割しません' '? – DyZ
可能であれば、Python 3..6を使用する必要があります。 – wwii
@DYZ申し訳ありませんが、いくつかの文で ' - ' – Sean