2017-06-27 14 views
2

私は3つの列を持つデータセットを持っています。5つ以上の観測値があるグループを選択する方法

price 
Factor (numeric var 1-15 categories) 
group (string (100 categories)) 

それぞれの要因カテゴリに必要なのは、観察が5つ以上あるグループだけです。それはどうですか?

これは間違っています。

new<-city[(city$group)>5,] 
+0

'?table'を使用して係数ごとの周波数を計算し、サブセット –

答えて

3

data.tableでこれを行うことができます。 'data.frame'を 'Factor'、 'group'でグループ化し、行数が5より大きいData.table(.SD)のサブセットを取得します。

library(data.table) 
setDT(city)[, .SD[.N >5], by = .(Factor, group)] 
+0

をxとすると、動作します。 –

+0

@ H.Siwコメントありがとうございます。 [ここ](https://stackoverflow.com/help/someone-answers)もチェックすることができます。 – akrun

関連する問題