2012-05-11 8 views
1

ですので、test_group、person_id、総額、購入数の列を持つデータセットがあります。これは本質的に人のリスト、消費量、購入回数、グループの種類です。R:ddply内のサブセットの長さを取得

私は以下のddplyコードを使っていくつかの要約統計量を得ています:

mean_rpu <- ddply(data, .(test_group), summarise, total_rpu=sum(gross), 
    total_users=length(person_id), total_purchasers=length(subset(data, 
    purchases > 0)$person_id), mean_rpu=mean(gross), sd_rpu=sd(gross)) 

私が実行している問題は、「total_purchasers」サマリーです。私は各test_group内の購入者である人々の数を取得しようとしています。現在のコードでは、test_group要素を再現するのではなく、データセット全体のtotal_purchasersのみが表示されます。私がこれでできる最適化は?

私は助けてくれてありがとう!

答えて

10

再現可能な例がなければその確かに言うのは難しいが、おそらくあなたは、この欲しかっ:

total_purchasers=length(person_id[purchases>0]) 
+0

素晴らしいを!それはまさに私が必要としたものでした。本当にありがとう! – user1062293

+1

@ user1062293あなたがうまくいけば答えを受け入れる必要があります –

+0

vその+ 1の役に立つtx – pssguy