8
私は教えている統計クラスの欠落データを処理する方法の例を生成するためにRを使用しています。 1つの方法では、「欠損値バイナリ変数」を生成する必要があります。欠損値を含むケースの場合は0、欠損値のない場合は1が必要です。 R- "欠損値変数"を生成する
n X Y Z
1 4 300 2
2 8 400 4
3 10 500 7
4 18 NA 10
5 20 50 NA
6 NA 1000 5
たとえば
、私はn m
1 1
2 1
3 1
4 0
5 0
6 0
欠損値を処理するために、Rの能力を考えると、これは簡単であるべきと思われるような、変数Mを生成したいと思います。私が見つけた最も近いものはm <-ifelse(is.na(missguns),0,1)
ですが、これはすべて、0または1の欠落を示すデータ・マトリックス全体を生成します。しかし、行に欠損値が含まれているかどうかを示す1つの変数が必要です。
おかげでトリックを達成しました!アップデートのように、私はRubinのt検定を実装していました。ここで私が生成したコードです。データセットは「ミスガン」(「銃」データセットですが、欠損値が含まれています)であり、変数の1つは「都市」です。不完全な<-as.integer(complete.cases(missguns)) 練習<-cbind(ミスガン、行方不明) がありません<-practice [practice $ missing == 0、] 完了<-practice [practice $ missing == 1 、] t.test($ urban、$ complete都市) –