2016-04-09 13 views
0

私は同じトレーニングとテストセットを使用していますが、何らかの理由で混乱マトリックスと出力プロットが実行ごとに異なります。各繰り返しは2つの精度のいずれかを実現:Rpartモデルがそれぞれ異なる結果を達成しています

fit_rpart <- train(goodbad~.,method='rpart',data=training, control = rpart.control(maxdepth = 30, minsplit=30, minbucket=1, cp=0.001)) 


fancyRpartPlot(fit_rpart$finalModel) 

pred_rpart <- predict(fit_rpart, testing) 
confusionMatrix(pred_rpart, testing$goodbad, positive = 'bad') 

答えて

1

rpartは、ランダムサンプリングを使用しています。それぞれの実行の前にset.seedを使用し、毎回同じモデルを取得する必要があります。

set.seed(100) 
fit_rpart <- train(goodbad~.,method='rpart',data=training, control = rpart.control(maxdepth = 30, minsplit=30, minbucket=1, cp=0.001)) 


fancyRpartPlot(fit_rpart$finalModel) 

pred_rpart <- predict(fit_rpart, testing) 
confusionMatrix(pred_rpart, testing$goodbad, positive = 'bad') 
+0

非常に@ michael-veale、ありがとうございました! – CJava

関連する問題