私はデータフレームパンダ:GROUPBY
df = pd.DataFrame({'member_id': [111, 111, 111, 111, 222, 222, 333, 333], 'event_duration': [12, 242, 3, 21, 4, 76, 34, 12], 'period': [1, 2, 2, 2, 3, 3, 4, 4]})
event_duration member_id period
0 12 111 1
1 242 111 2
2 3 111 2
3 21 111 2
4 4 222 3
5 76 222 3
6 34 333 4
7 12 333 4
を持っている私は
res = df.groupby(['member_id']).agg({'period': pd.Series.nunique, 'event_duration': np.median}).reset_index()
を使用する。しかし、それはすべての期間の中央値を印刷し、すべてのmember_id
と期間の中央値
にperiod
の数をカウントする必要があります。しかし、私は例えば111
のメジアンを1と2の間に得るには、[12, 266]
が必要です。どうすればいいですか?
期待される出力を示してください。あなたが望むものを理解することは不可能です。 –