私は同様のデータセットがあります。表生成R
val<-c("Y","N")
test<-data.frame(age=rnorm(n=100,mean=50,sd=10),var1=sample(val,100,T),var2=sample(val,100,T),var3=sample(val,100,T),sex=sample(c("F","M"),100,T))
I'dをHmiscを使用して、各カテゴリの平均年齢を報告要約を作成したいです。
library(Hmisc)
summary.formula(age~sex+var1+var2+var3,data=test)
しかし、VAR1-VAR3は、実際の代わりにY/NのレベルVAR1、varとVAR3と同じカテゴリ変数の下に属しています。さらに、これらは互いに排他的ではありません。だから、それは相互に排他的ではなく、これらの異なるレベルの変数VAR4を作成し、
summary.formula(age~sex+var4,data=test)
を入力等を出力持って何とか可能である:すべてのヘルプははるかに高く評価されるだろう
+-------+-+---+----+
| | |N |age |
+-------+-+---+----+
|sex |F| 44|48.0|
| |M| 56|50.8|
+-------+-+---+----+
|var4 |var1| xx|yy|
| |var2| xx|yy|
|var3| xx|yy|
+-------+-+---+----+
|Overall| |100|49.6|
+-------+-+---+----+
を..
私はあなたが望むものを理解していません。 Var4が何であるか、またはVar4のサブセットがVar4のためにどのように動作するはずであるかはわかりません。 – Dason