Iは、以下でdplyr
で自明data.frame
を集約することができる:R:(現在存在していない)すべての因子レベルによって集計
z <- data.frame(a = rnorm(20), b = rep(letters[1:4], each = 5))
library(dplyr)
z %>%
group_by(b) %>%
summarise(out = n())
Source: local data frame [4 x 2]
b out
(fctr) (int)
1 a 5
2 b 5
3 c 5
4 d 5
しかし、時々データセットは、因子が不足してもよいです。その場合は、出力を0
にしたいと思います。
たとえば、典型的なデータセットに5つのグループがあるとします。
z$b <- factor(z$b, levels = letters[1:5])
しかし、明確にはあり、この特定の内の任意のものではなく、他にある可能性があります。このデータを集計すると、が見つからないためfactors
は0
になります。
所望の出力:
Source: local data frame [4 x 2]
b out
(fctr) (int)
1 a 5
2 b 5
3 c 5
4 d 5
5 e 0
あなたはこの 'tapply(Zの$ bの、Zの$ bの長さ)' – Raad
のような 'tapply'を使用することができ、私は、これは[未解決の問題だと思いますon github](https://github.com/hadley/dplyr/issues/341)。 – JasonAizkalns