2016-10-24 4 views
2

重複する列名を持つデータフレームがあります。私はすべての同じエントリを1つにまとめる必要があります。パンダで重複する行を折りたたむ

データのCSVデータは次のようになり

、私が探しています

id,col1,col2,col1,col2 
'a',1,0,1,0 
'b',0,1,1,0 
'c',1,0,0,0 

結果は、

id,col1,col2 
'a',2,0 
'b',1,1 
'c',1,0 

私は列の上に合計します。

私はパンダには新しく、値を正しく集計する方法が見つからないようです。私は約> 4000列あることに注意してください。

+0

は、あなたの希望する結果に間違いの最初の行ですか? – DSM

+0

タイプミス、私はそれを修正しました。 – Stereo

答えて

5

あなたは、列名と集約sumgroupbyを使用することができます。

print (df.groupby(level= 0, axis=1).sum()) 
    col1 col2 id 
0  2  0 'a' 
1  1  1 'b' 
2  1  0 'c' 
関連する問題