2017-02-16 14 views
0

私のモデルごとに合計MSEboxplotsを作成して、モデルのエラーのバラツキを表示したいと考えています。エラーの分布を示すboxplotを生成するために、モデルを何度もサンプリングしてフィットさせる最良の方法は何ですか。複数のモデルをプロットするR

各モデルについて、すべてのデータ(列車と試験)の予測を生成します。私は次に列MSEを計算し、MSEsubsettingで予測します。次の関数は、両方の値を同時に計算します。

は、より良い再サンプルする方法と、各再サンプルすることにより、各モデルの plot MSEはありますか?どんな助けもありがとう。

calcMSE = function(model,modelLabel,dataSet,trainIdx,newX=NULL) 
{ 
    # The predict method for glmnet will need to be called differently from the 
    # other predict methods. 
    if ("glmnet" %in% class(model)) { 
    predVals = predict(model,newX,type="response") 
    } else { 
    predVals = predict(model,data) 
    } 
    MSE = list(
    name = modelLabel, 
    train = mean((predVals[trainIdx] - data$y[trainIdx])^2), 
    test = mean((predVals[-trainIdx] - data$y[-trainIdx])^2) 
    ) 

    return(MSE) 
} 

modelMSEs = data.frame(Model = rep(NA,8),Train.MSE = rep(NA,8),Test.MSE =  rep(NA,8)) 

modelMSEs[1,] = calcMSE(modelA1,"A1",Data,trainIdx) 
modelMSEs[2,] = calcMSE(modelA2,"A2",Data,trainIdx) 
modelMSEs[3,] = calcMSE(modelB1,"B1",Data,trainIdx) 
modelMSEs[4,] = calcMSE(modelB2,"B2",Data,trainIdx) 
modelMSEs[5,] = calcMSE(modelC1,"C1",Data,trainIdx) 
modelMSEs[6,] = calcMSE(modelC2,"C2",Data,trainIdx) 

print(modelMSEs) 

答えて

0

それはパッケージ「cvTools」のように見えるは、1つのCVワット/ファンクションbwplot.cvを-折るkから結果のボックスおよびウィスカープロットをプロットすることができます。これはより良いルートかもしれません。ありがとう。

関連する問題