2016-09-27 5 views
0

私はpandas DataFrameを持っています。私はgroupby(['target'])。count()をやっています。これは正常に動作します。しかし、私が望むものの1つは、各グループについて、ID列の一意の要素の数です。重複は削除しますが、最初のインスタンスと空のセルはPandasで重複したままにしておきますか?

私がしたいのは、ID列の場合、ID値の最初のコピー以外のすべてをヌルにします(IDはグループ固有のものなので、その問題について心配する必要はありません)。それから、groupby()。count()は各グループの一意のIDの数を私に与えます...しかし、私はそれを行う方法がわかりません。

+5

それとも、[ '.nunique()'](http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.nunique.html)を使用することができます。 –

+0

それは私に独特のものの数を全体として与えます。グループではありません。グループごとに必要です –

+2

nuniqueもgroupbyオブジェクトで定義されています。あなたは 'df.groupby( 'target')['ID']を実行できます。nunique()' – ayhan

答えて

関連する問題