0
I 2列を含む大きな売上データセット(> 1 M行)を有する:固有の日付に基づいて、周波数(forループの代わり)R
- CLIENT_ID
- PURCHASE_DATE
クライアントIDが頻繁に繰り返されます。
各行について、「過去30日間にクライアントが何回購入したか」を計算したいと思います。
- CLIENT_ID
- PURCHASE_DATE
- Freq_Last_30_Days
現在、I各行をループとnrowしない()は、次の基準を使用してカウント:
data$Client_ID == data$Client_ID[i]
data$Purchase_Date < data$Purchase_Date[i]
data$Purchase_Date >= data$Purchase_Date[i] - 30
データベースのサイズを考えると、これは何時間もかかります。 forループを使用せずに周波数を見つけるより効率的な方法はありますか?
検索。 – xosp7tom
また、[ここ](http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example)をチェックすることもできます。 – akrun