あなたは図書館員であり、時間がたっている間に は多くの種類のテキストファイルを分類しています(約100) 一般的なあいまいなキーワードです。テキストファイルを2つのグループに分ける - 教師なし学習
すべてのテキストファイルには、実際にkeyword_meaning1 またはkeyword_meaning2の話題のトピックです。
どの教師なし学習アプローチあなたは二つのグループにテキストファイルを分割する 、使うのでしょうか?
正しい分類 の(パーセンテージ)どのような精度は、テキストファイルの数に応じて達成することができますか?
それとも何とか は、彼らが間違ってclassifedすることができる ので、特定のファイルをチェックする司書の必要性があることを、1つのグループに指示することができますか?
監修ベイズ法はありませんか?トレーニングフェーズで?またはこれはいくつかの変更ですか? – xralf
はい、監督しています。私は問題文からクラスラベルを利用できることに気づいたので、ナイーブなベイズは最も単純なアプローチに見えました。 – JooMing
carrot2ありがとう。 – xralf