私は、2つの変数グループbaseline変数(var1-var5)とフォローアップ変数(tar1-tar5)を持つデータフレームを取得しています。 ID変数とを含む。このデータフレームには、欠落があります。2つの変数グループのそれぞれに1つまたは複数の非NA値があります
私はそこであるすべての観測値の数と割合を取得できるようにしたいと思います:1以上1またはVAR1-VAR5変数との複数の値の両方をtar1-tar5変数のいずれかよりも優先されます。下のmweでは、観測02-06では観測01ではなく、私の基準を満たしているので、5と0.83の割合を期待しています。
私が数と割合について得たコードは、どの変数にも欠けがないという観測を与えてくれるだけで、私はそれをどのように変更するのか分かりません。どんな助けでも大歓迎です。
ポイント開始:
df <- data.frame(ID=c("01","02","03","04","05","06"),var1=c(NA,"a","a","a","a","a"),var2=c(NA,NA,"b","b","b","b"),var3=c(NA,NA,NA,"c","c","c"),var4=c(NA,NA,NA,NA,"d","d"),var5=c(NA,NA,NA,NA,NA,"e"),tar1=c(NA,"a","a","a","a","a"),tar2=c(NA,NA,"b","b","b","b"),tar3=c(NA,NA,NA,"c","c","c"),tar4=c(NA,NA,NA,NA,"d","d"),tar5=c(NA,NA,NA,NA,NA,"e"), stringsAsFactors = FALSE)
現在のコード:私たちは非NAと「タールである少なくとも一つの「VAR」を探しているように説明に基づいて
sum(!is.na(df$var1) & !is.na(df$var2) & !is.na(df$var3) & !is.na(df$var4) & !is.na(df$var5) & !is.na(df$tar1) & !is.na(df$tar2) & !is.na(df$tar3) & !is.na(df$tar4) & !is.na(df$tar5))
sum(!is.na(df$var1) & !is.na(df$var2) & !is.na(df$var3) & !is.na(df$var4) & !is.na(df$var5) & !is.na(df$tar1) & !is.na(df$tar2) & !is.na(df$tar3) & !is.na(df$tar4) & !is.na(df$tar5))/nrow(df)