列の値によってグループとパンダ

に指標として設定し、私はこのようになりますデータフレームdf1あります列の値によってグループとパンダ

df1 = pd.DataFrame({'A':[0,5,4,8,9,0,7,6], 
        'B':['a','s','d','f','g','h','j','k'], 
        'C':['XX','XX','XX','YY','YY','WW','ZZ','ZZ']})

を行が持つように、私の目標は、列Cに含まれる値に応じてグループに要素であります同じ値で、同じインデックスを持ちます（これには、Cに格納されている値が含まれている必要があります）。したがって、出力は次のようにする必要があります：

A B 
XX 0 a 
    5 s 
    4 d 
YY 8 f 
    9 g 
WW 0 h 
ZZ 7 j 
    6 k

私はコマンドdf.groupby('C')を使用しようとしましたが、それは次のオブジェクトを返します。

<pandas.core.groupby.DataFrameGroupBy object at 0x000000001A9D4860>

は、あなたは私の私の目標を達成するために、エレガントでスマートな方法を提案することはできますか？

注：私は私の質問は、何らかの形でマルチインデックス

出典

2017-08-07 Federico Gentile

あなたは 'df1.set_index（ 'C'）を'意味ですか？ – Zero

それは似ていますが、私のやりたいことが異なっている間に各要素に割り当ててインデックスを付けるので、私の問題には適合しません...私はデータフレームの内容にアクセスするためのインデックスを持っていたいと思います –

に関連していると思うことが必要MultiIndex場合は、列CとAからDataFrame.set_index

df2 = df1.set_index('C') 
print (df2) 
    A B 
C  
XX 0 a 
XX 5 s 
XX 4 d 
YY 8 f 
YY 9 g 
WW 0 h 
ZZ 7 j 
ZZ 6 k 

print (df2.loc['XX']) 
    A B 
C  
XX 0 a 
XX 5 s 
XX 4 d

を必要とするようだ：

df3 = df1.set_index(['C', 'A']) 
print (df3) 
     B 
C A 
XX 0 a 
    5 s 
    4 d 
YY 8 f 
    9 g 
WW 0 h 
ZZ 7 j 
    6 k 

print (df3.loc['XX']) 
    B 
A 
0 a 
5 s 
4 d

出典

2017-08-07 11:45:17 jezrael

Iあなたがpivot_table、つまり

を探していると思います

pd.pivot_table(df1, values='A', index=['C','B'])

出力：

 
     A 
C B 
WW h 0 
XX a 0 
    d 4 
    s 5 
YY f 8 
    g 9 
ZZ j 7 
    k 6

出典

2017-08-07 11:56:15 Dark

列の値によってグループとパンダ

答えて

関連する問題