私はtrainSA
とtestSA
という名前のデータセットを使用しています。とりわけ、列番号はchd age alcohol obesity tobacco typea ldl
です。train(method = "glm"、...)とglm(...)は同じ回答を期待していますか?
このコマンドは(私はRで働いていることに注意してください)
set.seed(13234)
modFit<-train(chd~ age+ alcohol+ obesity +tobacco +typea +ldl, method="glm",family="binomial", data=trainSA)
missClass(testSA$chd, predict(modFit,testSA))
戻り0.3116883
、しばらくこの1
set.seed(13234)
modFit<-glm(chd~ age+ alcohol+ obesity +tobacco +typea +ldl, family="binomial", data=trainSA)
missClass(testSA$chd, predict(modFit,testSA))
戻り0.2943723
。
同じシードで1つずつ実行することができ(したがって、他のすべてのパラメータを同じに保ちます)、わずかに異なる結果が得られます。
これは予期されているのですか、それともどちらかに追加する必要があるコマンドがありますか?
注:この質問では、他のコードの詳細は含まれていないと考えていますが、必要に応じてこれを行うことができます。