最近私はwekaの使用を開始し、Naive Bayesを使用してツイートを肯定的または否定的に分類しようとしています。だから私は私がラベルを与えたつぶやきと、すべてが "陽性"というラベルをつけたつぶやきのテストセットを持ったトレーニングセットを持っています。 「私はテストセットでツイートのラベルを変更する場合は、6、8%正しく分類されたインスタンスの意味weka
:
正しく分類インスタンス:69 92% 間違って分類されたインスタンス私はナイーブベイズを実行したときに、私は次のような結果を得ますネガティブ」と再びナイーブベイズを走った、結果が反転されています
正しく分類インスタンス:6 8% 誤って分類インスタンス:69 92%
私が正しく分類インスタンスはナイーブベイズとその正確さを示していると考えそれは同じでなければならないテストセットのつぶやきのラベルに関係します。データに問題がありますか、正しく分類されたインスタンスの意味が正しく理解されていませんか?
おかげで、あなたの時間のためにたくさん、
Nantia
素早く回答いただきありがとう@Junnux&Antimonyありがとうございました!テストセットは次のように作成されます:私は自分のプログラムに検索タームを与え、twitter apiはこの用語を含むつぶやきを返し、これらのツイートはテストセットを構成し、Naive Bayesが実行されます。だから、私はテストセットの正しいラベルを追加することができません。私があなたをよく理解していれば、この場合、テストセットのラベルの分類子の回答を得ることができますが、私は正確さを評価することができません。私はそれを正しく得たか? – nadia
トレーニングセットのラベルが少なくともあるとします。あなたがそれを持っていなくても、あなたは間違ったアプローチを取っています。 Naive Bayesは教師付き学習のアルゴリズムです。ラベルがない場合、探しているのは__unsupervised__学習です。これは異なるアルゴリズムセットを必要とし、一般的にはもっと悪い結果をもたらします。私は教師なし学習のためにあなたのデータにラベルを付ける方法やGoogleを見つけることをお勧めします。 – Antimony
はい、私の目的は教師あり学習なので、私の訓練セットのラベルがあります。もう一度ありがとう!あなたは本当に私がいくつかのものを整理するのを手伝ってくれました。 :) – nadia