2017-01-06 5 views
1

私は2つの列を持つデータフレームを持っています。最初の列、たとえばAには重複があり、2番目の列には重複がありません。drop_duplicates in pandas重複が最初の列にある場合

私は

df["A"].drop_duplicates(inplace=True) 

を試してみましたが、それは同じ数の行を返します。 列「A」の値が同じ行を削除するにはどうすればよいですか?

例:

John Miller 
John Smith 
Mark Robinson 
Jeffrey Robinson 

John Miller 
Mark Robinson 
Jeffrey Robinson 
パラメータと

答えて

2

使用drop_duplicatessubset返す必要があります:

df.drop_duplicates(subset=['A'],inplace=True) 
print (df) 
     A   B 
0  John Miller 
2  Mark Robinson 
3 Jeffrey Robinson 

ドキュメント:

サブセット:ラベルの列ラベルまたはシーケンス、オプションの

これだけは私が欲しかったものであるグレート、

+0

デフォルトの使用により、重複を識別するためのすべての列を特定の列を検討します。 – user

関連する問題