モデルのチューニング時に生成されるROC/Sens/Specと、同じデータセットのモデルが実際に行った予測との違いがあるようです。私はkernlabのksvmを使用するキャレットを使用しています。私はglmでこの問題を経験していません。キャレットとsvmの予測のクロスバリデーション
data(iris)
library(caret)
iris <- subset(iris,Species == "versicolor" | Species == "setosa") # we need only two output classess
iris$noise <- runif(nrow(iris)) # add noise - otherwise the model is too "perfect"
iris$Species <- factor(iris$Species)
fitControl <- trainControl(method = "repeatedcv",number = 10, repeats = 5, savePredictions = TRUE, classProbs = TRUE, summaryFunction = twoClassSummary)
ir <- train(Species ~ Sepal.Length + noise, data=iris,method = "svmRadial", preProc = c("center", "scale"), trControl=fitControl,metric="ROC")
confusionMatrix(predict(ir), iris$Species, positive = "setosa")
getTrainperf(ir) # same as in the model summary
この矛盾の原因は何ですか?どのようなものが「真の」相互検証後の予測ですか?