私はpandas DataFrameを持っています。私はgroupby(['target'])。count()をやっています。これは正常に動作します。しかし、私が望むものの1つは、各グループについて、ID列の一意の要素の数です。重複は削除しますが、最初のインスタンスと空のセルはPandasで重複したままにしておきますか?
私がしたいのは、ID列の場合、ID値の最初のコピー以外のすべてをヌルにします(IDはグループ固有のものなので、その問題について心配する必要はありません)。それから、groupby()。count()は各グループの一意のIDの数を私に与えます...しかし、私はそれを行う方法がわかりません。
それとも、[ '.nunique()'](http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.nunique.html)を使用することができます。 –
それは私に独特のものの数を全体として与えます。グループではありません。グループごとに必要です –
nuniqueもgroupbyオブジェクトで定義されています。あなたは 'df.groupby( 'target')['ID']を実行できます。nunique()' – ayhan