2016-10-13 9 views
-2

私はデータセットを部分的に代用するためにRでmissForestパッケージを使用しようとしています。詳細には、すべてのメトリック変数を代用したいが、いくつかの列だけを残しておきたい。これは可能ですか?missForestによる部分代入

+0

あなたは 'm [、1:4] < - missForest(m [、1:4])'のようなものを試しましたか? – jmartindill

+4

再現可能な例を教えてください。 –

+0

悲しいことに私が使用しているデータセットは会社のデータであるためです。( – Glassjawed

答えて

0

質問を正しく理解していれば、私は解決策があります。私はあなたに完全に再現可能なコードを提供するつもりです。

## Get some data... 
data(iris) 

## The data contains four continuous and one categorical variable. 
## Artificially produce missing values using the 'prodNA' function: 
set.seed(81) 
iris.mis <- prodNA(iris, noNA = 0.1) 

## Impute missing values for just the first four columns of data 
iris.mis[,1:4] <- missForest(iris.mis)$ximp[,1:4] 

このようなアプローチが有効かどうかを教えてください。うまくいかない場合は、例のコードを使用して理由を示すことができるかどうかを確認してください。

0

私が理解したように、いくつかの列を残して、missForestの機能を持つ他の列を代入する必要があります。簡単な解決策は

imputedData <- missForest(dataset[c(2, 3)]) 
dataset <- data.frame(dataset[1], imputedData) 

パス列が(ここでは2,3)帰属し、その後戻ってそれを組み合わせることが必要です。

関連する問題