私は、約3000の正のサンプルと1500の負のサンプルのデータセットを持っています。すべての機能は実数です。私は "randomForest" RパッケージでrandomForestクラシファイアをトレーニングしたいと思います。randomForest:100%を取得する方法 - 精度?
問題は、トレーニングデータセットで100%精度(TP/TP + FP)の分類子が必要なことです。しかし、訓練されたランダムフォレストで$投票を調整することで、これを達成することはほとんどできません。
誰かがこのような問題について経験を持っているのか、それとも何か考えがあるのだろうか?何か手がかりがある場合は、私にいくつかのヒントを与えてください。前もって感謝します!
私は100%の精度を約束すれば他の機械学習方法にも触れています。
リコール= TP /(TP + FN)。精度= TP /(TP + FP)。 http://en.wikipedia.org/wiki/Precision_and_recall#Definition_.28classification_context.29 –