2017-02-07 18 views
0

を使用しているとき、私は次のコードを持っている非重複要素を数える:パンダ:集計

data_agg_df = data_df.groupby("team", as_index=False).player.agg({"player_set": lambda x: set(list(x)), "player_count": "count"}) 

data_agg_df 

をそれから私はset(list(x))player_countの出力がlist(x)の値ではありません気づきました。重複していないプレーヤー、つまりset(list(x))をここでカウントするにはどうすればよいですか?どうもありがとう!

答えて

1

私が正しく理解していれば、あなたはユニークな選手の数を取得するためにnuniqueを使用することができます:上記と同様に代わりnuniqueuniqueを使用し、あなたはユニークな選手の配列をしたい場合は

data_agg_df = data_df.groupby("team", as_index=False).player.agg({"player_set": "nunique", "player_count": "count"}) 

を。

関連する問題