3
に基づいSOME重複する値を削除します。パンダ:私はデータセット持っている条件
id url keep_if_dup
1 A.com Yes
2 A.com Yes
3 B.com No
4 B.com No
5 C.com No
を、私は、重複を削除すなわち「URL」フィールドの最初の発生を保つ、しかしフィールド「keep_if_dup場合は重複を維持したいです"はYESです。
予想される出力:
id url keep_if_dup
1 A.com Yes
2 A.com Yes
3 B.com No
5 C.com No
私が試したもの:もちろん考慮されていません
Dataframe=Dataframe.drop_duplicates(subset='url', keep='first')
"keep_if_dup" フィールド。出力は次のとおりです。
id url keep_if_dup
1 A.com Yes
3 B.com No
5 C.com No
このコマンドは「df」データフレームを変更しますか?df = df.loc [...]これを保存する必要がありますか? – Vincent
あなたのdfを上書きしたい場合は自己割り当てをして戻したいので 'df = df.loc ....' – EdChum
あなたの答えを編集していただきありがとうございました – Vincent