パンダで重複する行を折りたたむ

重複する列名を持つデータフレームがあります。私はすべての同じエントリを1つにまとめる必要があります。パンダで重複する行を折りたたむ

データのCSVデータは次のようになり

、私が探しています

id,col1,col2,col1,col2 
'a',1,0,1,0 
'b',0,1,1,0 
'c',1,0,0,0

結果は、

id,col1,col2 
'a',2,0 
'b',1,1 
'c',1,0

私は列の上に合計します。

私はパンダには新しく、値を正しく集計する方法が見つからないようです。私は約> 4000列あることに注意してください。

2016-10-24 Stereo

は、あなたの希望する結果に間違いの最初の行ですか？ – DSM

タイプミス、私はそれを修正しました。 – Stereo

あなたは、列名と集約sumでgroupbyを使用することができます。

print (df.groupby(level= 0, axis=1).sum()) 
    col1 col2 id 
0  2  0 'a' 
1  1  1 'b' 
2  1  0 'c'

2016-10-24 10:36:32 jezrael

答えて