リスト - として1列を維持:今すぐデータフレームから重複行を削除するが、私はこのようなデータフレーム持っているPythonの
file:
| FIRST | LAST | ID |
---------------------------
0 "ABC" 12 35
1 "ABC" 14 35
2 "AB" 15 36
を、私が欲しいのです。この問題については
file:
| FIRST | LAST | ID |
---------------------------
0 "ABC" [12,14] 35
2 "AB" 15 36
のがあることを想定してみましょう2行のIDが等しい場合、LASTを除くすべての値も同じです。
したがって、リストに追加されたlastの値を除くすべての値を置き換えます。
私は、このリンクで与えられた解決策使用してみました:
ID
35 [12, 14]
36 [15]
Name: Last, dtype: object
おそらく、私は何かが欠けています:これは私が得た出力である
file = file.groupby('ID')
file = file['Last'].unique()
:私はこれを使用し Pandas DataFrame - Combining one column's values with same index into list
をgroupby()の中で。事前に
感謝:)
UPDATE:
私の元データフレームは、100の以上の列があります。 2行のIDが等しい場合、LASTを除くすべての値も同じです。
これは私にとって完璧に機能します。ありがとう –
複数の列を使ってgroupby()にしたいのですが? –
上記の編集を参照してください。 – Alexander