データが欠落している2つの列があります。2つの列の欠損値を除外する観測のサブセットを見つけよう
Var1 Var2
1445 40
656 NA
NA NA
607 NA
2098 15
これらの列間の相関を計算し、欠落したデータを除外したいと考えています。私は
cor(na.omit(df$Var1),na.omit(df$Var2),method="pearson")
を試してみました。しかし、私は、)$ var2のdfを(COR(na.omit($ VAR1 DF)、na.omitで
エラーを取得: 互換性のない寸法
これは、2つの変数の交点を取るのではなく、私が得ていると考えているからです。
Var1(NA omit) Var2(NA omit)
1445 40
656 15
607
2098
であるため、列の長さが変更されるため、相関を実行することはできません。
NA
を含むすべての観測を省略して、列の長さを同じにするにはどうすればよいですか?
'COR($ VAR1 DF na.omit()、$ var2のDF na.omit()、メソッド= "ピアソン"、=「ペアワイズを使用.complete.obs ")' – kaksat
しかし、あなたはこれを読んでみたいと思うかもしれません:[Pairwise-complete correlation with dangerous](http://bwlewis.github.io/covar/missing.html)。 –
ありがとう、これについて知りませんでした。 – kaksat