重複は削除しますが、最初のインスタンスと空のセルはPandasで重複したままにしておきますか？

私はpandas DataFrameを持っています。私はgroupby（['target']）。count（）をやっています。これは正常に動作します。しかし、私が望むものの1つは、各グループについて、ID列の一意の要素の数です。重複は削除しますが、最初のインスタンスと空のセルはPandasで重複したままにしておきますか？

私がしたいのは、ID列の場合、ID値の最初のコピー以外のすべてをヌルにします（IDはグループ固有のものなので、その問題について心配する必要はありません）。それから、groupby（）。count（）は各グループの一意のIDの数を私に与えます...しかし、私はそれを行う方法がわかりません。

それとも、[ '.nunique（）']（http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.nunique.html）を使用することができます。 –

それは私に独特のものの数を全体として与えます。グループではありません。グループごとに必要です –

nuniqueもgroupbyオブジェクトで定義されています。あなたは 'df.groupby（ 'target'）['ID']を実行できます。nunique（）' – ayhan

DataFrame.duplicated()の方法は、ここで説明したようにしたい場合はここに適用できます。 IDの最初の出現がFalseで残りがTrueの系列を返すことができます。これをマスクとして使用して、重複IDをnullに設定することができます。

2016-09-27 19:23:57 scomes

答えて