Merged
という名前のという名前のPandasデータフレームがあります。Pandas.Dataframe.duplicated()に重複している行が含まれています
私はそうのように、このデータフレームから重複を取得するためにPandas.Dataframe.duplicated()
メソッドを使用しています:結果も重複としてRegimentalNumber
の欠損値を含んよう
In [16]: Merged[Merged.RegimentalNumber.duplicated() == True]
しかし、それが見えます。
欠損値を重複として除外するために、duplicated()
メソッドはフラグまたはパラメータを使用しますか?この方法ではAPI Documentationを見ましたが、このようなフラグは見つかりませんでした。
もちろん私は、単にこのように欠損値を除外することができます。
In [17]: duplicates = Merged[Merged.RegimentalNumber.duplicated() == True]
In [18]: duplicates[duplicates.RegimentalNumber.notnull()]
しかし、duplicated()
方法も重複として欠損値が含まれていることを私に権利いないようです。よりシンプルでワンステップのソリューションはありますか?
'duplicated'は' NaN'を 'False'として扱うべきですので、生データとコードを再現するコードを投稿する必要があります。 – EdChum