カテゴリ化変数の出現回数をカウントして列を作成する

-3

user.idのそれぞれについて、varの値の出現回数を数える変数をいくつか作成します。次に例を示します。カテゴリ化変数の出現回数をカウントして列を作成する

user.id  var 
    1   A 
    1   B 
    2   A 
    2   A 
    2   C 
    3   C

期待される結果：

user.id  var_A var_B  var_C 
    1   1   1   0 
    2   2   0   1 
    3   0   0   1

出典

2017-06-02 velvetrock

'table（df $ user.id、df $ var）' –

'dcast（df1、user.id〜var、length）'をちょうど実行します。 – akrun

我々はdata.table

と tidyverse

library(tidyverse) 
df1 %>% 
    count(user.id, var) %>% 
    spread(var, n, fill = 0) 
# A tibble: 3 x 4 
# user.id  A  B  C 
#* <int> <dbl> <dbl> <dbl> 
#1  1  1  1  0 
#2  2  2  0  1 
#3  3  0  0  1

以上の効率的なアプローチでこれを行うことができます

出典

2017-06-02 09:37:49 akrun

カテゴリ化変数の出現回数をカウントして列を作成する

答えて

関連する問題