私は、特定の形式でリストに読みたいテキストファイルを持っています。私が取得したいのですが 27/08/15, 15:45 - text
continue text
continue text 2
27/08/15, 16:10 - new text
new text 2
new text 3
27/08/15, 19:55 - more text
を:: 27/08/15, 15:
のリスト内の単語に分割する文字列私は(リストの次のリストを持っている): [[u' why not giving me service'], [u' option to'], [u' removing an'], [u' verify name and '], [u' my credit card'], [u' credit card'], [u' theres something on my v
現在、数字、単語、記号(つまり、 "、?、:、:、 - 、+など)を含む非常に長いテキストがあります。私は純粋に言葉だけでテキストを持っているので、テキストからすべての数字や記号をダウンストリップ 私の期待がある(例えば、下記にセマンティクスを無視する):。ここ (BEFORE Sanitization) John's pet (Parson) is sleeping in a car: a BM