は、以下の最初の2列(count
& dt
)のようなデータフレームを考えると、私は、表示される内容各dt
(例えば7日間のウィンドウで見られる明確なdts
の数はに至るまでの(は含まない)を取得していますよnum_distinct_dts_prior_7_days
)。Pythonでは、各行に関連した特定の日付ウィンドウ内にあるデータフレーム内の行のユニークなカウントを取得する最も良い方法は何ですか?
ix count dt num_distinct_dts_prior_7_days
0 6 2017-12-01 0
1 2 2017-12-02 1
2 2 2017-12-04 2
3 9 2017-12-05 3
4 4 2017-12-10 2
5 7 2017-12-14 1
6 2 2017-12-28 0
7 3 2017-12-29 1
これはテーブルの簡略化されたバージョンです。最終的には私のデータフレームにはさらにid
という列があり、7月のウィンドウに表示されるdts
の個数はそれぞれdt
,、id
のそれぞれになります。完全なデータセット全体に適用できる解決策がない場合は、id
(O(千の傾向))を繰り返すことができます。
はすべてのための 'dt' – Dark
一意の列' dt'列は、各 'id'に対して一意になります(例えばです使用することができます'id'私たちは' count'値を持つ一意の 'dt'のリストを持っています –