1
パンダの類似の列を削除するPythonの方法はありますか?私が意味するのは、1対1対応の列です。例えば、類似の列を削除するpandas
colA colB colC
A C B
A G B
C K D
C G D
ここで私は唯一の私はいつもcolC
を知っcolA
知っているのでcolA
とcolB
を保持したいと思います。
パンダの類似の列を削除するPythonの方法はありますか?私が意味するのは、1対1対応の列です。例えば、類似の列を削除するpandas
colA colB colC
A C B
A G B
C K D
C G D
ここで私は唯一の私はいつもcolC
を知っcolA
知っているのでcolA
とcolB
を保持したいと思います。
factorize
dを有する後にdrop_duplicates
を使用する1つの方法。 1対1対応がある場合、私は2つの列が同じ方法で分解されることを知っています。
cols = df.apply(lambda x: pd.factorize(x)[0]).T.drop_duplicates().index
df[cols]
colA colB
0 A C
1 A G
2 C K
3 C G
解決方法は正しいですが、転置は高価な操作であるため大きなデータフレームでは失敗します。 – Linda