pandas factorize
関数は、系列内の各固有値を順次0ベースのインデックスに割り当て、各系列エントリがどのインデックスに属するかを計算します。パンダの複数列因子分解
私は複数の列にpandas.factorize
と同等のものを達成したいと思います:
import pandas as pd
df = pd.DataFrame({'x': [1, 1, 2, 2, 1, 1], 'y':[1, 2, 2, 2, 2, 1]})
pd.factorize(df)[0] # would like [0, 1, 2, 2, 1, 0]
、私は、データフレームのいくつかの列の値の一意の各タプルを決定したい、にシーケンシャルインデックスを割り当てていることeach、およびデータフレーム内の各行がどのインデックスに属するかを計算します。
Factorize
は、単一の列でのみ機能します。パンダに複数の列に相当する機能がありますか?
あなたの予想出力は何ですか? – waitingkuo
コメント内のリスト - 別個の(x、y)値ごとに一意の連続したインデックス – ChrisB