2017-03-09 10 views
-3
df = pd.DataFrame({"ID":['A','B','C','D','E','F'], 
       "IPaddress":['12.345.678.01','12.345.678.02','12.345.678.01','12.345.678.18','12.345.678.02','12.345.678.01'], 
       "score":[8,9,5,10,3,7]}) 

私はPythonとPandasライブラリを使用しています。 IPアドレスが重複している行については、スコアが最も高い行(スコアは0〜10)のみを選択し、すべての重複を削除したいとします。Python Pandas独自の値

私はこのロジックをPython関数に変換するのが難しいです。

+0

df.loc [df.groupby(「IPアドレス」)[「スコア」]。idxmax()] – Johnny

+1

ジョニー、それはあなたがスタックに新しいものかもしれないように見え、あなたがdownvoted取得することができる理由を不思議に思っています「普通の」質問のようです。下降音の理由は、あなたが試したことを投稿していないということです。それは、あなたが「あなたの宿題をやっている」と思っているかもしれません。実際、この質問はフォーラムの他のメンバーと非常によく似ています。将来、あなたが試みたコードを投稿してください。ここでより理解を深めるために、[documentation](http://stackoverflow.com/help/mcve)を読んでください。私たちはあなたに最高のことを願っています。 – MattR

+0

非常に良い点。私は次回に投稿したことを含めています。ありがとうございます。 – Johnny

答えて

0
df.loc[df.groupby('IPaddress')['score'].idxmax()] 
+0

このコードスニペットは問題を解決するかもしれませんが、[説明を含む](http://meta.stackexchange.com/questions/114762/explaining-entirely-code-based-answers)役職。将来読者の質問に答えていることを覚えておいてください。そうした人々はあなたのコード提案の理由を知らないかもしれません。 – DimaSan

関連する問題