1
Iワンホットエンコードする場合、このような3つの可能な値を持つ列:2つの値を持つワンホットエンコード列はどうですか?
from sklearn import preprocessing
lb = preprocessing.LabelBinarizer()
lb.fit([0, 1, 2])
lb.classes_
lb.transform([1, 0])
それから私は得る:
array([[0, 1, 0],
[1, 0, 0]])
私が望む正確に何です。可能な値ごとに3列= 1列。
しかし、私はこのような2つの可能な値がある場合:lb.fit([0, 1])
lb.classes_
lb.transform([1, 0])
は、私が手を:
私は2つの可能な値を持っている場合でも、唯一の1列ですarray([[1],
[0]])
。この場合、私はどのようにして終了したいですか:
array([[0, 1],
[1, 0]])
この場合、2列の結果はどのようにして得られますか?
[OK]を、それは解決策のように見えます。しかし、私はどのようにフィット関数にパンダのデータフレームの単一の列を供給するのですか? LabelBinarizerは本当に簡単ですが、OneHotEncoderはPandas列を直接取っていないようです。 – OlavT
パンダでは 'get_dummies'を使うことができます。例えば; 'df = pd.DataFrame(data = {'a':[0,1,0]})'と 'pd.get_dummies(df ['a'])' – Xevaquor