2017-02-28 3 views
0

累積データが追加の列として追加されるように、IDと月に基づいてデータ使用量を累積しようとしています。df pythonの2つの列の値に基づいてデータを累積します。

これはDFのサンプルのための私のコードです:

df = pd.DataFrame({'ID':["SAD1", "SAD2", "SAD1", "SAD2", "SAD1", "SAD2", "SAD3"], 
       'Month':["201701","201701","201702","201702","201703","201703", "201703"], 
       'Usage':[20,40,100,50, 30, 30, 2000]}) 

私のデータフレームは、次のようになります。

 ID Month Usage 
0 SAD1 201701  20 
1 SAD2 201701  40 
2 SAD1 201702 100 
3 SAD2 201702  50 
4 SAD1 201703  30 
5 SAD2 201703  30 
6 SAD3 201703 2000 

私はで終わるしたい結果は次のとおりです。

 ID Month Usage Cum Usage 
0 SAD1 201701  20   20 
1 SAD2 201701  40   40 
2 SAD1 201702 100  120 
3 SAD2 201702  50   90 
4 SAD1 201703  30  150 
5 SAD2 201703  30  120 
6 SAD3 201703 2000  2000 

誰でも私のdfにこれを適用する方法を助けることができますか?

+0

'のDF [ 'スペルマ用法'] = df.groupby([ 'ID'])。CUMSUM()'? – Abdou

答えて

4

groupbycumsum

df['Cum Usage'] = df.groupby('ID').cumsum() 
関連する問題