行が特定のユーザーによって行われたトランザクションを表すデータフレームがあります。複数の行が同じuser_idを持つことができることに注意してください。カラム名性別とuser_idのランニングを考える:他の列で条件が指定された列のカテゴリの一意の値を集計する
df.gender.value_counts()
は周波数を返しますが、彼らはおそらく回以上指定されたユーザーをカウントすることができるので、彼らは偽です。例えば、50人の男性が実際にはそれほど少ないとは言えます。
value_counts()
は、user_idごとに1回だけカウントする方法はありますか?
可能性のある重複した[パンダとの一意の値をカウント](http://stackoverflow.com/questions/38309729/count-unique-values-with-pandas) – ayhan
なぜだろうか一意の 'user_id'を選択せず、後で' gender'でグループ化しません。うまくいけば、あなたのユーザーはあまりにも頻繁に性別を変更しないでください。 – jbndlr