私はランダムフォレスト分類子を構築しています。分類と関連する確率を返したいと思います。私の結果変数は1
または0
です.1は私が追跡したいポジティブなクラスです。私は確率が陽性結果の確率を返したかったランダムフォレスト()は、肯定結果と分類の確率を返します
no_of_trees <- 50
rf.under <- randomForest(as.factor(result) ~ . ,
data=data_balanced_under,
importance=TRUE,
ntree=no_of_trees)
prediction <- predict(rf.under, df.test)
probability <- predict(rf.under, df.test, type="prob")
submit <- data.frame(predicted = prediction, actual = df.test$result)
は、しかし、私が手:私の出力で
> probability
0 1
242339 1.00 0.00
3356431 1.00 0.00
138327 1.00 0.00
111327 1.00 0.00
3307151 1.00 0.00
222414 1.00 0.00
1817297 1.00 0.00
3860922 1.00 0.00
1710532 1.00 0.00
。左の数字は何ですか?彼らが何であるかわからないのですか?私は彼らが行番号だと思ったが、なぜ1,2,3 ..から索引付けされていないのだろうか? probability[,2]
と結びついて結果が出る確率は高くなると思うが、うまくいきません。
理想的には、submit
データフレームに確率を含めたいと考えていますが、現時点ではそうすることはできません。
また、混同行列は私を与える:
confusionMatrix(data = submit$predicted, reference = df.test$result , positive="1")
#Reference
Prediction 0 1
0 913730 160
1 50872 8219
は、この周りをスイッチすることが可能ですか?最初にポジティブなクラス "1"を表示するように?
[here](https://stackoverflow.com/questions/5963269/how-to-make-a-great-r-)に記載されているように、データの再現可能な例を提供してください。再現可能な例)。 –