0
複数のカテゴリのデータセットがあります。私は各カテゴリの新しいdfsにデータをサブセット化することなく、各カテゴリに対して線形回帰を実行したいと思います。私はこのようにしました:カテゴリごとに回帰を実行し、カテゴリ平均の+/- 10%を境界にします。
category = c(rep(c("a","b","c"),100))
x = (rep(1:5,60))
y = rnorm(300)*5
df = data.frame(category,x,y)
models = dlply(df, "category", function(dflm)
lm(y ~ x, data = dflm))
lmcoefs = ldply(models, coef)
lmcoefsでは、私は今、各カテゴリの係数を格納しています。
私はこれらの回帰を各カテゴリの平均の+/- 50%以内で実行したいと思います。したがって、カテゴリAの平均y値が10の場合、カテゴリーAのy値5と15の間で回帰を実行したいだけです。
これを行う方法はありますかデータセットを分割して個々の回帰を実行することなく、
おかげで、 ドン
ありがとう、@ウェーブ! 1つの修正 - range.minはm *(1-perc)で、range.maxはm *(1 + perc)にする必要があります –
はい、ありがとうございました。しかし、今修正されました。 – Wave