私はA
とB
という2つの列を持つデータフレームを持っています。この文脈ではA
とB
の順番は重要ではありません。たとえば、私は(0,50)
と(50,0)
を重複していると考えます。パンダでは、これらの複製をデータフレームから削除する効率的な方法は何ですか?パンダ:データフレームから逆の重複を削除
import pandas as pd
# Initial data frame.
data = pd.DataFrame({'A': [0, 10, 11, 21, 22, 35, 5, 50],
'B': [50, 22, 35, 5, 10, 11, 21, 0]})
data
A B
0 0 50
1 10 22
2 11 35
3 21 5
4 22 10
5 35 11
6 5 21
7 50 0
# Desired output with "duplicates" removed.
data2 = pd.DataFrame({'A': [0, 5, 10, 11],
'B': [50, 21, 22, 35]})
data2
A B
0 0 50
1 5 21
2 10 22
3 11 35
理想的には、出力は列A
の値でソートされます。
ラムダを必要とせず、 '.apply(sorted、axis = 1)'が動作します。 – root
@root。そのとおり。より良い選択肢。 – Psidom
私はこの答えが大好きです!私が思ったことはすべて、データフレームに積み重ねることでした。この巧みさは、その必要性を排除します。 – piRSquared