混乱行列のトレーニングとテストレコードの数を使用して、ナイーブベイズ分類器の精度を計算するという概念に精通しています。数学的には、訓練セットのみを使用してナイーブベイズ分類器の精度を計算するという概念はありますか?どんな提案も素晴らしいだろう。 例トレーニングセット: A B Class
0 0 _
1 1 +
Naive Bayes分類法(Multinomial NB)については、Michael Sipserの著書「The Theory of Computation」の記述方法を参照して説明しました。 私はトレーニングと、次のように提示多項NBを、適用の両方に記載されたアルゴリズムで探しています: アルゴリズムの特定の側面を解釈するときしかし、私はロスに来ています。例えば、6行目のTRAINMULTIN
私は、(Document Term Matrixを構築して)テキストデータから予測を行うためにNaive BayesをRで実行しようとしています。 私は訓練とテストセットの両方で欠けている可能性のある用語についていくつかの記事を読んでいました。そのため、1つのデータフレームで作業し、後で分割することにしました。私が使用しているコードはこれです: actual
predicted 1 2 3