2017-10-25 20 views
0

私は以下のサンプルのようなデータフレーム "df"を持っています。私はaddressとbusiness_idを一意のキーとして使い、addressとbusiness_idの組み合わせに基づいて一意なレコードしか持たないようにデータフレームをフィルタリングしたいと思います。誰もそれを行う方法を提案することはできますか?データフレームから重複を削除

コード:

print df[["address","business_id","city"]][1:3] 

サンプルデータ:

   address    business_id  city 
1  2824 Milton Rd mLwM-h2YhXl2NCgdS84_Bw Charlotte 
2 337 Danforth Avenue v2WhjAB3PIBA8J8VxG3wEg Toronto 
+3

'df.drop_duplicates(["アドレス"、" business_id "])' – MaxU

+0

[Python Pandasですべての重複行を削除](https://stackoverflow.com/questions)の可能な複製/ 23667369/drop-all-duplicate-rows-in-python-pandas) – DJK

答えて

-1

重複を取り除くとともに、あなたがdf.set_index使用したい

df.set_index(keys=["address","business_id"]) 
関連する問題