私は3つの列を持つデータセットを持っています。5つ以上の観測値があるグループを選択する方法
price
Factor (numeric var 1-15 categories)
group (string (100 categories))
それぞれの要因カテゴリに必要なのは、観察が5つ以上あるグループだけです。それはどうですか?
これは間違っています。
new<-city[(city$group)>5,]
私は3つの列を持つデータセットを持っています。5つ以上の観測値があるグループを選択する方法
price
Factor (numeric var 1-15 categories)
group (string (100 categories))
それぞれの要因カテゴリに必要なのは、観察が5つ以上あるグループだけです。それはどうですか?
これは間違っています。
new<-city[(city$group)>5,]
data.table
でこれを行うことができます。 'data.frame'を 'Factor'、 'group'でグループ化し、行数が5より大きいData.table(.SD
)のサブセットを取得します。
library(data.table)
setDT(city)[, .SD[.N >5], by = .(Factor, group)]
をxとすると、動作します。 –
@ H.Siwコメントありがとうございます。 [ここ](https://stackoverflow.com/help/someone-answers)もチェックすることができます。 – akrun
'?table'を使用して係数ごとの周波数を計算し、サブセット –