library(dplyr)
df %>%
count(Color, Gender) %>%
mutate(prop = prop.table(n))
# Source: local data frame [4 x 4]
# Groups: Color [3]
#
# Color Gender n prop
# (fctr) (fctr) (int) (dbl)
# 1 Blue M 1 1.0000000
# 2 Red F 2 0.6666667
# 3 Red NA 1 0.3333333
# 4 NA M 1 1.0000000
更新you-がありがとうございました。これを行うにはtidyr
:
library(tidyr)
library(dplyr)
gather(df, "var", "value", -RespondentID) %>%
count(var, value) %>%
mutate(prop = prop.table(n))
# Source: local data frame [6 x 4]
# Groups: var [2]
#
# var value n prop
# (fctr) (chr) (int) (dbl)
# 1 Color Blue 1 0.2
# 2 Color Red 3 0.6
# 3 Color NA 1 0.2
# 4 Gender F 2 0.4
# 5 Gender M 2 0.4
# 6 Gender NA 1 0.2
何を試しましたか – rawr
いくつの列ですか?あなたの場合、単純な 'table'または' prop.table'が行います。 –
私は、2つの異なるデータセットに対してほぼ10の列を持っています。 私はこれらの2つのデータセットの傾向の違いを示すバープロットを作成するために、各変数(列)の数値(カウントと%)を取得したいと考えています。 – Rooz