2017-06-02 21 views
-3

user.idのそれぞれについて、varの値の出現回数を数える変数をいくつか作成します。次に例を示します。カテゴリ化変数の出現回数をカウントして列を作成する

user.id  var 
    1   A 
    1   B 
    2   A 
    2   A 
    2   C 
    3   C 

期待される結果:

user.id  var_A var_B  var_C 
    1   1   1   0 
    2   2   0   1 
    3   0   0   1 
+4

'table(df $ user.id、df $ var)' –

+0

'dcast(df1、user.id〜var、length)'をちょうど実行します。 – akrun

答えて

0

我々はdata.table

tidyverse

library(tidyverse) 
df1 %>% 
    count(user.id, var) %>% 
    spread(var, n, fill = 0) 
# A tibble: 3 x 4 
# user.id  A  B  C 
#* <int> <dbl> <dbl> <dbl> 
#1  1  1  1  0 
#2  2  2  0  1 
#3  3  0  0  1 

以上の効率的なアプローチでこれを行うことができます

関連する問題