Wordpressには、Akismetというスパムフィルタリングプラグインがあります。このプラグインは、テキストのブロックをスパムとして分類することができるようです。インターフェイスとデータベース/アルゴリズムを通過する必要があるという唯一の注意点は、オープンソースでも簡単に利用できるものでもありません。無料のスパム対策データベースはありますか?
また、Webアプリケーションでユーザーから送信された電子メール、コメントまたはその他のテキストを分類するためのWebアクセス可能なAPIを提供する商用プロバイダもあります。
テキストブロックを迷惑メール/非迷惑メールとして分類できるオープンソースのデータベースや自由にアクセスできるデータベースはありますか?
編集:ここで私は
は基本的に私がスパムであること、特定のフレーズの確率でそこに大規模なデータベースがあったことを期待していた何をしたいの明確な説明を示します。スパム送信者はすべてのメールアドレスに平等にスパムを送信するので、ベイジアンスパムフィルタをこのデータベースに事前に設定することで、ユーザートレーニングなしでほとんどのスパムをキャプチャすることから始まるアプリケーションを作成できます。
私は、テキストのブロックを迷惑メールとして分類できるデータベースを探しています。たとえば、Akismet(ワードプレスプラグイン)は、任意のコメントをスパムとして分類することができます。 –
Jonが述べたように、データベースは分類にはあまり役に立ちません。 Akismetは、データベースに対してチェックするのではなく、スパムの作成に使用される手続き型の生成を模倣しています。 – JoshJordan
これらのリンクをありがとう。スパムを分類するためのアルゴリズムは数多くありますが、スパムシグネチャの優れたデータベースは非常に価値があります。私は、WordpressやGoogleのような誰かが無料のデータベースとしてスパム署名を公開してくれることを期待していました。まあ、私は知っている。しかし、男は夢を見ることができますか? –