人工データを使った線形回帰のシミュレーションを行い、RSEとR Squareを手動で計算しています。私は、モデルを訓練したIn Sampleデータセットに対してこれを行い、次にOut of Sampleデータセットでモデルをテストします。サンプル外およびサンプル内のデータは、同じ正規分布から引き出されますが、異なるシードが使用されます。私の数字は、サンプル外のデータセットに関しては意味がありません
は、この例を考えてみましょう: data <- data.frame(predictor = c(1,2,3,4,5,6),
dv = c(5,3,5,6,6,1),
id = c(1,2,3,1,2,3))
model <- lm(dv ~ predictor, subset = id, data = data)
summary(model)
私はそれがlm関数に、たとえば、sub