1
に従ってデータフレームの列の重複した値を削除します。何百万行ものデータフレームでデータのクリーニングを実行しています。 それは、この例のようになります。ID番号
id transaction_date expire_date
0 A 2015-01-01 2015-02-01
1 A 2015-01-01 2015-03-14
2 A 2015-01-01 2015-06-19
3 A 2015-01-01 2015-07-01
4 B 2016-02-02 2016-03-02
5 C 2016-01-01 2016-01-15
私は意味をなさない期限切れと異なる日付と同じ日に3つのほど多くのトランザクションに行0から削除したいと思います。それは正しい方法
私はこの
df.drop_duplicates(subset='transaction_date')
と思っていますか?
必要性のチェック2列は 'df.drop_duplicates(サブセット=必要な場合['id'、 'transaction_date']) ' – jezrael
私は答えにコメントを投稿します...... df.drop_duplicates(サブセット= ['id'、 'transaction_date']、keep = False)' – Wen