mice
を使用して50個のデータセットを作成した後、glmnet
を使用して弾性ネットを実行したいと考えています。帰属データを分析する適切な方法は、mice(x,...)
が実行されたときに作成されたmids
オブジェクトにwith
とpool
関数を適用することですが、glmnet
はデータを行列として供給する必要があることを理解しています。 model.matrix
とbuild.x
の両方を使用して、汎用データフレームをマトリックスに変換することができます。 mids
オブジェクトはdata.frameに変換できます。ただし、利用可能なデータを単一のデータセットとして使用すると、完全な帰属プロセスが損なわれるように見えます。弾性ネットで使用するために帰属データに行列を生成する
例:
df <- mice::nhanes
imp <- mice(df) #impute data
com <- complete(imp, "long", TRUE) #creates data frame
mat <- build.x(bmi ~ age + hyp + chl, com, contrasts = FALSE)
と仮定すると、インピューテーションは、インピューテーションを維持し、glmnet
で使用するために、関連する行列を作成するための最も適切な方法は何か、正確ですか?