2015-12-16 33 views
6

をカウントし、私はこのようになりますDATAFRAME持っパンダGROUPBYが

+------+------+-------+-------+--------+ 
|  | 1-10 | 11-25 | 25-50 | 51-100 | 
+------+------+-------+-------+--------+ 
| john | 1 |  1 |  1 |  1 | 
| jane | 1 |  1 |  1 |  1 | 
+------+------+-------+-------+--------+ 

をI試してみました:

bins = [1, 10, 25, 50, 100] 
groups = df.groupby(pd.cut(df.views, bins)) 
groups.username.count() 

ただし、ユーザーによって集計されたカウントのみでカウントされます。ユーザーごとにビン数を取得するにはどうすればよいですか?

(私の実際のデータを使用して)集計カウント

は次のようになります。

impressions 
(2500, 5000]   2332 
(5000, 10000]  1118 
(10000, 50000]  570 
(50000, 10000000]  14 
Name: username, dtype: int64 

答えて

7

あなたは両方のビンユーザ名でグループ、グループの大きさを計算してから使用することができunstack()

>>> groups = df.groupby(['username', pd.cut(df.views, bins)]) 
>>> groups.size().unstack() 
views  (1, 10] (10, 25] (25, 50] (50, 100] 
username 
jane   1   1   1   1 
john   1   1   1   1