2017-02-05 13 views
0

私は以下のようなデータセットを持っている:頻度数

Col1. Col2. Col3.  Col4 
A  123  D   J 
B  234  E   M 
A  234  D   J 

私はちょうど列が正確にCOL3とCOL4 COL1に完全一致の頻度数を持つ第五列を追加する必要があります。

予想される出力:

Col1. Col2. Col3.  Col4. Col5 
A  123  D   J.  2 
B  234  E   M.  1 
A  234  D   J.  2 

答えて

1

あなたが使用することができますgroupby + transform('count')

In [70]: df['Col5'] = df.groupby(['Col1','Col3'])['Col2'].transform('count') 

In [71]: df 
Out[71]: 
    Col1 Col2 Col3 Col4 Col5 
0 A 123 D J  2 
1 B 234 E M  1 
2 A 234 D J  2