2016-07-08 12 views
0

私はこのgroup_byを使用して2つ以上の因子変数による統計を要約する方法は?

no  date   charges 
050034 2011-07-14 3312.00 
000859 2012-07-13 10913.54 
05266  2013-07-16 159.00 
000859 2012-07-13 370.00 
000859 2014-07-16 21881.36 
38027  2012-07-13 164.00 

のようなデータフレームを持っている私は、ユニークな日付の各ノー、日付ごとの平均総費用グループを見つけたいです。

no  date   charges 
050034 2011-07-14 3312.00 
000859 2012-07-13 11283.54 
05266  2013-07-16 159.00 
000859 2014-07-16 21881.36 
38027  2012-07-13 164.00 

(我々は唯一2012-07-13 1つのノー= 000859を持っている)が、私のコードは正常に動作しません: は、私はこのような結果を得るために

summary<-df %>% group_by(no) %>% summarize_each(funs(total_charges=sum(charges))) 

を使用しました!

EDIT :::::: どのように各ノーの毎月の合計料金の平均を見つけることができますか?

+0

@Procrastinatusマクシムスを私は同様の質問を見つけることができませんでした私の質問を投稿する前に! – Sajjad

+0

問題はありません、あなたの問題が今解決されたことを願って – Jaap

+0

私はより具体的に私の質問を編集しました – Sajjad

答えて

0

あなたのデータフレームがdfあなたが使用することができますと呼ばれていると仮定すると:

aggregate(charges ~ no + date, data=df, sum) 
0

あなたができる複数の変数によってグループ:

df%>%group_by(date,no)%>%summarise(total_charges=sum(charges))

+0

どのようにして毎月の合計料金が平均でnoになるのでしょうか? – Sajjad

+0

@Sajjadあなたの質問は合計を求めたので、この答えは 'sum'を使用していました。平均を計算するためのR関数は 'mean()'なので、合計の代わりに平均を求めたい場合は、 'sum()'の代わりに 'mean()'を使うべきです。入門用リソース[Rタグwiki](http://stackoverflow.com/tags/r/info)の一部を見ることができます。 – Gregor

関連する問題