0
私はショーのチケットIDを持つ列を持っています(各家族は同じチケットIDを使用します)。チケットの回数を数えてファミリサイズの新しいcloumnを作成したい繰り返される。パンダの列の繰り返しをカウントする
ticketID
113796
2543
19950
382653
349211
3101297
PC 17562
113503
113503
私はショーのチケットIDを持つ列を持っています(各家族は同じチケットIDを使用します)。チケットの回数を数えてファミリサイズの新しいcloumnを作成したい繰り返される。パンダの列の繰り返しをカウントする
ticketID
113796
2543
19950
382653
349211
3101297
PC 17562
113503
113503
これを試してみてください。
In [123]: df = pd.DataFrame({'ticketID':np.random.randint(0, 3, 5)})
In [124]: df
Out[124]:
ticketID
0 1
1 2
2 1
3 1
4 2
In [125]: df['family_size'] = df.ticketID.map(df.ticketID.value_counts())
In [126]: df
Out[126]:
ticketID family_size
0 1 3
1 2 2
2 1 3
3 1 3
4 2 2
あなたは、あなたが作った試みるものを示す必要がスタックオーバーフローでtransform
In [152]: df
Out[152]:
ticketID
0 1
1 2
2 1
3 1
4 2
In [153]: df['family_size'] = df.groupby('ticketID')['ticketID'].transform('size')
In [154]: df
Out[154]:
ticketID family_size
0 1 3
1 2 2
2 1 3
3 1 3
4 2 2
を使用することができます。いくつかの点については、http://stackoverflow.com/help/how-to-askを参照してください。 – Mikkel
['df.ticketID.values_counts()'](http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.value_counts.html)コードを書くだけではありません。 – piRSquared