pythonでnltkライブラリを使用して電子メールから "from:"、 "to:"、 "cc:"をフィルタリングまたは削除しようとしています。 これを実行する方法はありますか? PS:私は電子メールスレッドからの、からの削除
をPYTHONに新しいです。ここメール
こんにちはのスレッドがある、
いくつかのテキスト
おかげで、
名前と詳細
名と詳細
投稿者:XXX //ここで私はこの分野送信
を読みたくない:YYY:2016年3月24日(木曜日)11時20分AMは、//ここで私は、このフィールド
を読みたくありませんいくつかのテキスト
こんにちは、
いくつかのテキスト
ありがとう:.COM //ここで私は、このフィールドに
件名を読みたくありません!
名前と詳細
から:ここではいくつかの名前//私は
が送信され、このフィールドを読みたくない:2016年3月4日(金曜日)午前2時40分PM //ここで私はしないでくださいこのフィールド
を読みたい:yyy.com //ここで私は、このフィールドに
件名読みたくない:いくつかのテキスト
ねえが、
のPythonでいくつかのテキスト
「Excelファイルにある電子メールダンプ」がどのように構築されるのか想像もつきません。個々のメッセージから電子メールヘッダーを削除するのは簡単ですが、データ表現が見えない場合は、あまりにも曖昧です。広すぎると投票に投票する。 – tripleee
いいえExcelファイルの列にある電子メールを読み込もうとしていて、「from:」、「to:」などのようなものを除外しなければなりません。 – user3125261
あなたの作品を見せてください。これまでに何を試しましたか? – Soviut