私は現在、複数の購入を含む大規模な顧客購入データセットを扱っています。(顧客)データの集計R
お客様が毎年購入したかどうかを確認することにのみ関心があるため、これらの購入を顧客レベルで集約する効率的な方法を探しています。
最終結果は、各行が一意の顧客を表す表として多少見えるはずです。私は、彼が特定の年に買ったかどうかを示す真偽変数を表示しています。簡単な例:私はこのことで作成しようとした
Customer id Bought 2014 Bought 2015
1 TRUE TRUE
2 TRUE FALSE
:
Customer id Product id year
1 1 2014
2 2 2014
1 3 2015
結果はのようになります。
生データに似ていますfor - ifループを使用して作成するしかし、これは巨大な実行時間を持っているように見えます。このため、使用しているデータセットのサイズでは使用できなくなります。 また、for-ifループを使用する場合、私は 'FUN ='ステートメントとして何を使用するのか不明なため、顧客レベルでデータを集計するのに苦労しています。これはdplyr
を使用して怒鳴る
多分 'table'; '(df、table(customerID、year)> 0)'を使って '。 – lmo