Pandasを使用して、毎日新しいユーザーの数を計算したいという、次のデータが与えられています。Pandasで毎日見られる新しいIDの数を計算する
Data:
Day | UserID
----------
1 | A
1 | B
1 | C
1 | C
----------
2 | A
2 | B
2 | D
2 | A
2 | E
----------
3 | B
3 | D
3 | F
Result:
Day | New Users
---------------
1 | 3
2 | 2
3 | 1
私はそれを見る方法、手順は次のとおりです。
- 計算日あたりの最大ユーザーID:df.groupby( '日')UserID.max()
- 前日の最大ユーザーID(0で初期化)でデータをフィルタリングします。ここで私はパンダを使ってこれを行う方法がありません
- フィルタリングされたデータセット上の一意のユーザーからのサインイン数を計算します。 df.filtered.groupby( '日')。UserID.nunique()
これを達成するためのクリーンな方法はありますか?
きちんとし。ありがとうございました! – bsuire