2016-12-25 13 views
0

私はショーのチケットIDを持つ列を持っています(各家族は同じチケットIDを使用します)。チケットの回数を数えてファミリサイズの新しいcloumnを作成したい繰り返される。パンダの列の繰り返しをカウントする

ticketID 
113796 
2543 
19950 
382653 
349211 
3101297 
PC 17562 
113503 
113503 
+2

を使用することができます。いくつかの点については、http://stackoverflow.com/help/how-to-askを参照してください。 – Mikkel

+1

['df.ticketID.values_counts()'](http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.value_counts.html)コードを書くだけではありません。 – piRSquared

答えて

1

これを試してみてください。

In [123]: df = pd.DataFrame({'ticketID':np.random.randint(0, 3, 5)}) 

In [124]: df 
Out[124]: 
    ticketID 
0   1 
1   2 
2   1 
3   1 
4   2 

In [125]: df['family_size'] = df.ticketID.map(df.ticketID.value_counts()) 

In [126]: df 
Out[126]: 
    ticketID family_size 
0   1   3 
1   2   2 
2   1   3 
3   1   3 
4   2   2 
1

あなたは、あなたが作った試みるものを示す必要がスタックオーバーフローでtransform

In [152]: df 
Out[152]: 
    ticketID 
0   1 
1   2 
2   1 
3   1 
4   2 

In [153]: df['family_size'] = df.groupby('ticketID')['ticketID'].transform('size') 

In [154]: df 
Out[154]: 
    ticketID family_size 
0   1   3 
1   2   2 
2   1   3 
3   1   3 
4   2   2 
関連する問題