-1
すでに作成されたダミー変数を使用して:非喫煙者、軽喫煙者、中等度喫煙者、重度喫煙者、私は出生体重の平均、中央値およびSDを求める必要がありますY)を計算する。私はコードがシンプルだと確信していますが、それは私の頭をスリップし、正しい答えを見つけることができません。Rstudioのダミー変数を使ってYの平均、中央値、SDを調べる
すでに作成されたダミー変数を使用して:非喫煙者、軽喫煙者、中等度喫煙者、重度喫煙者、私は出生体重の平均、中央値およびSDを求める必要がありますY)を計算する。私はコードがシンプルだと確信していますが、それは私の頭をスリップし、正しい答えを見つけることができません。Rstudioのダミー変数を使ってYの平均、中央値、SDを調べる
require(data.table)
cats <- c('non-smoker',
'heavy-smoker',
'moderate-smoker',
'light-smoker')
df <- data.frame(bweight = 100 + 30*rnorm(100),
status = sample(cats,100, replace = T))
dt <- data.table(df)
dt2 <- dt[,.(mean = mean(bweight),
sd = sd(bweight),
median =median(bweight)),
status]
dt2
status mean sd median
1: heavy-smoker 108.02752 22.56118 113.35685
2: light-smoker 100.86848 30.78375 104.00167
3: non-smoker 95.92386 24.54260 97.62238
4: moderate-smoker 106.45183 29.73191 106.81698
コメントをいただきありがとうございます、あなたは正しいです。私はset.seedを使用する必要があります、私は次回覚えようとします。 –
おそらく '?aggregate'を見てください。ダミー列ごとに別々に集計する必要があります。 Btw、あなたのデータセットと関心のある変数、MASS :: birthwtとbwtについてはこちらをご覧ください。 – Frank