2017-03-03 8 views
3

現在メールアドレスがメーリングリストアドレスかグループメールアドレスか個人用メールアドレスかを判断する機能を構築しています。私の現在の戦略は人間によるマニュアル注釈を使用しており、これらのデータは受信メールアドレスを決定するために使用されます。例[email protected]は郵送先住所なので、このメールアドレスの名前はrecruitmentで、グループとしてマークするので、今後は名前がrecruitmentであれば無視します。手動注釈で構築されたデータセットを使用せずにこの機能を構築する他のソリューションはありますか?どんな助けでもありがたいですメールアドレスがメーリングリストアドレスか個人用メールアドレスかを判断

答えて

0

ドメインアドレスをフィーチャー、またはその両方の名前として使用すると意味があります。結局のところ、多くのメーリングリストは企業であり、多くの個人アドレスはYahoo、Gmailなどのサイトから来ています。追加機能を使用すると、パーセプトロンのようなメールを分類する学習アルゴリズムを作成するためのより多くのデータを得ることができますhttps://en.wikipedia.org/wiki/Perceptron)。このアプローチには手動更新が含まれていますが、時間の経過とともにスマートに機能を拡張することができます。

関連する問題