私は、顧客が購入する速度に興味 列でグループ化して日付を再サンプリングできますか?
CustomerID InvoiceDate
13654.0 2011-07-17 13:29:00
14841.0 2010-12-16 10:28:00
19543.0 2011-10-18 16:58:00
12877.0 2011-06-15 13:34:00
15073.0 2011-06-06 12:33:00
のように見えるいくつかの消費者の購入データを持っています。各顧客ごとにグループ化し、各四半期に購入した購入数を確認したいとします(各四半期は1月から3ヶ月ごととしましょう)。
各四半期の開始と終了を定義して別の列を作成することができます。私は同じことを達成するために代わりにgroupby
を使用できるかどうか疑問に思っています。
現在、これは私がそれを行う方法です。
r = data.groupby('CustomerID')
frames = []
for name,frame in r:
f =frame.set_index('InvoiceDate').resample("QS").count()
f['CustomerID']= name
frames.append(f)
g = pd.concat(frames)
閉じます。私はまた、顧客IDでグループ化したい。私はそれを行う方法を見つけた、ありがとう。 –
@DemetriP、答えを更新しました - – MaxU
を確認してください。ありがとう! –