この辺りで私の頭を掴みようとしています。dplyr
。変数に基づいてグループ化したいソートされたデータフレームがあります。しかし、グループは、それぞれがグループ化変数上で最小合計30を持つように構成する必要があります。dplyrを動的group_byに使用する
は、この小さな例のデータフレームを考えてみましょう:
今df1 <- matrix(data = c(05,0.9,95,12,0.8,31,
16,0.8,28,17,0.7,10,
23,0.8,11,55,0.6,9,
56,0.5,12,57,0.2,1,
59,0.4,1),
ncol = 3,
byrow = TRUE,
dimnames = list(c(1:9),
c('freq', 'mean', 'count')
)
)
count
は、少なくとも30 freq
とmean
の合計が、その後重みがあるweighted.mean
に崩壊する必要があります持っているように、私はグループにしたいですcount
値。最後の "bin"は行7で32の合計に達しますが、行8:9は2にしか足らないので、最後の "bin"に加算します。
ので、同じように:
freq mean count
5.00 0.90 95
12.00 0.80 31
16.26 0.77 38
45.18 0.61 34
dplyr
との簡単な要約は問題ではありませんが、これは私が把握することはできません。私は解決策はどこかにここに隠されていると思います:
Dynamic Grouping in R | Grouping based on condition on applied function
しかし、どのように私の状況に適用するには私をエスケープします。