私はPHP(http://www.xhtml.net/php/PHPNaiveBayesianFilter)よりNaive Bayesianクラシファイアで働いていますNaive Bayesian Classifierの無視される単語のリストはどれですか?
そして、システムのトレーニング中に無視できる単語のリストがあります。これらの単語はデータベースに保存されないため、分類には使用されません。 私は可能な限りシステムを改善したいので、この種のシステムでは無視するべき典型的な言葉の規則やリストがあるかどうか疑問に思っていました。
"to"、 "and"、 "the"、 "for"、 "since"、 "which"、 "what"、 "who" ...などの一般的な動詞を無視しています。 "あった"、 "あった"、 "された"、 "された"
お勧めはありますか?おかげさまで
システムのトレーニング内容によって異なります。 。ベイジアンは、このスパムフィルタの多くのために使用することができます – Baba
ちょうどスポーツ、政治、技術と経済の4つのカテゴリにいくつかのテキストを分類する。 – Alvaro