集計関数に関する以下のソースコードと同様に、ここでlist function()を使用する必要がある理由を理解できません。むしろ、これを、グループ化する必要がある1つの列を使用して置き換えることにします。なぜ私は 'train [Sales!= 0]'のような同じデータセットを2回使用するのか分かりません。 2番目のデータセットパラメータとして他のデータセットを使用するとどうなりますか?私はそれがかなり高い可能性のある間違いに変わると思う。集計関数が直感的ではない
aggregate(train[Sales != 0]$Sales,
by = list(train[Sales != 0]$Store), mean)
多分これは間違った使用例です。しかし、私はまた、このソースコードをRのマニュアルで見た。
## Compute the averages for the variables in 'state.x77', grouped
## according to the region (Northeast, South, North Central, West) that
## each state belongs to.
aggregate(state.x77, list(Region = state.region), mean)
私の質問を読んでくれてありがとう。
あなたのコードが間違っている可能性があります。 'train 'が行列またはdata.frameの場合、このコマンド' train [Sales!= 0] 'はあなたにすでにエラー(' undefined columns selected')を与えます。それにもかかわらず、 'list()'関数を避けるために 'aggregate(Sales〜Store、data = train [Sales!= 0、]、mean)'を行うことができます。 'state.x77'はすでにアタッチされているデータセットなので、この例のように使用できます。 – Jimbou