1
私はPandasデータフレームの2つの列間に重複を削除する効率的な方法を探しています。だから、私のデータは、私はそれを取得したいパンダドロップ2列間の重複
A B
0 1 0
1 1 1
2 nan 2
3 8 3
4 7 7
で、
A B
0 1 0
1 nan 2
2 8 3
は、どのように私はそのような出力を得ることができますか?ありがとう!
私はPandasデータフレームの2つの列間に重複を削除する効率的な方法を探しています。だから、私のデータは、私はそれを取得したいパンダドロップ2列間の重複
A B
0 1 0
1 1 1
2 nan 2
3 8 3
4 7 7
で、
A B
0 1 0
1 nan 2
2 8 3
は、どのように私はそのような出力を得ることができますか?ありがとう!
はこれを試してみてください:
df = df[df.A != df.B]
要求されるようにループを使用して:
dups_index = []
for i, row in df.iterrows():
if row['A'] == row['B']:
dups_index.append(i)
df = df[~df.index.isin(dups_index)]
それは動作しますが、私は多くのことを、それは効率的ではないと思います。 : – anniejcannon
申し訳ありませんより効率的なアプローチを見つけたら、私に教えてください:) –
これはループ内ではおそらく効率的ではありません。しかし、私はそれを私の答えに加えます。 –