2017-08-19 37 views
0

マイウェカOneRモデルがすべてのようにのような特定の結果につながる疑問符を締結し、オーバーフィットセットのように思える戻ってきている。Weka OneRには?分類器モデルとして

FollowersMeanCoords_Col: 
    < 0.33340000000000003 -> False 
    >= 0.33340000000000003 -> True 
    ? -> False 
(114357/163347 instances correct) 

は単に私が見つけることができない」と言って、このOneRです何か、私たちは残りが偽であると仮定します? "しかし、なぜ、日付が明確にカットされているのですか(0.33未満はすべてFalse、それ以上はTrue)?これを防ぐ方法はありますか?

ありがとうございます!

答えて

1

?には値がありません。トレーニングデータの中には、いくつかの場合には値がFollowersMeanCoords_Colでないものが必要です。

あなたの質問内のモデルは、インスタンス(データ・ポイント)のためFollowersMeanCoords_Col未満0.3334 ...、をあるかが欠落している場合、それはそれ以外の場合はTrueとしてそれを分類する、Falseとしてインスタンスを分類することを言います。

OneRは、分類ルールの作成に使用されたときにエラーが最も少ないトレーニングデータから1つの属性を見つけることによって機能する非常に単純な分類アルゴリズムです。 OneRからoverfitの場合、訓練データをよく分類する属性が必要ですが、将来のテストデータには一般化しませんでした。 OneRが堅牢ではあるが不正確なモデルを提供する可能性が高くなります。

関連する問題