2017-01-16 2 views
0

私は、データフレームが見えるように、次のようにカウント

A,B,C,D 
X1,desc,may 1, 1 
X2,desc, june 5, 1 
Y,desc, dec 8, 2 
Y,desc, jan 4, 3 

私はX1、X2、およびY.和を見てみたい、次のように見えるのデータフレームを持っている:

A,B 
X1,1 
X2,1 
Y,5 

したがって、X1のすべてのインスタンスについて、それらを合計します(X2およびYについても同様です)。これについて私が知らない便利なパンダ関数はありますか?私は本当に悪い解決策を知っています。すべてをリストに抽出して、それが存在するかどうかを確認し、その方法を集計してデータフレームに戻すことができますが、これをすべて行うためのより良い方法があるかどうかはわかりませんパンダ。基本的には集合体のようなものです。

+0

'groupby.sum()'関数を見てください。 –

+0

ああありがとう!あなたは列Aをグループ化して合計を使用することができます –

+0

しかし、もしAがインデックスであれば、これはどのように機能しますか? df ['A']を呼び出すことはできません –

答えて

0

場合は、ここにあるとして、グループに列をインデックスとして設定されている場合:希望する結果が得られ、どの

df1.groupby([df1.index]).D.sum() 

 B  C  D 
    A    
    X1 desc may 1 
    X2 desc june 1 
    Y desc dec 2 
    Y desc jan 3 

は、単に以下のようにインデックスでグループを使用します。

A 
X1 1 
X2 1 
Y  5 
Name: D, dtype: int64