データフレームから重複を削除

私は以下のサンプルのようなデータフレーム "df"を持っています。私はaddressとbusiness_idを一意のキーとして使い、addressとbusiness_idの組み合わせに基づいて一意なレコードしか持たないようにデータフレームをフィルタリングしたいと思います。誰もそれを行う方法を提案することはできますか？データフレームから重複を削除

コード：

print df[["address","business_id","city"]][1:3]

サンプルデータ：

   address    business_id  city 
1  2824 Milton Rd mLwM-h2YhXl2NCgdS84_Bw Charlotte 
2 337 Danforth Avenue v2WhjAB3PIBA8J8VxG3wEg Toronto

出典

2017-10-25 user3476463

'df.drop_duplicates（["アドレス"、" business_id "]）' – MaxU

[Python Pandasですべての重複行を削除]（https://stackoverflow.com/questions）の可能な複製/ 23667369/drop-all-duplicate-rows-in-python-pandas） – DJK

-1

重複を取り除くとともに、あなたがdf.set_index使用したい

df.set_index(keys=["address","business_id"])

出典

2017-10-25 23:23:28

データフレームから重複を削除

答えて

関連する問題