私はNaive Bayesを使ってテキストの文書ベースを分類しようとしています。各ドキュメントは、1〜n個のカテゴリに属することがあります(ブログ記事のタグと考える)。 私の現在のアプローチは、目的の動作が Some new text to classify
そして のような出力のように見えるの入力を持つことである。もちろん、この +-------------------------+--
以下のRスクリプトを使用して、Twitterのコメント(カザフ語)の感想分析を行っています。 3000(1500sad、1500happy)はトレーニングセットのコメント、テストセットの1000(happy sad mixed)コメントです。すべてがうまくいきますが、最終的に予測値はすべて幸せを示していますが、これは正しくありません。 私はすべての機能をチェックしており、すべてnaiveBayes