0
私は、列車とテストのデータセットを使用して、Pythonのランダムフォレストを使用して予測モデルを作成しようとする初心者です。 train ["ALLOW/BLOCK"]は4つの期待値のうち1つを取ることができます(すべての文字列)。 test ["ALLOW/BLOCK"]は予測する必要があります。Pythonでfactorize()を使った後の元の値の取得方法は?
y,_ = pd.factorize(train["ALLOW/BLOCK"])
y
Out[293]: array([0, 1, 0, ..., 1, 0, 2], dtype=int64)
私はpredict
を予測に使用しました。
clf.predict(test[features])
clf.predict(test[features])[0:10]
Out[294]: array([0, 0, 0, 0, 0, 2, 2, 0, 0, 0], dtype=int64)
数字の代わりに元の値を取得するにはどうすればよいですか?次のコードは、実際の値と実際の値を実際に比較していますか?
z,_= pd.factorize(test["AUDIT/BLOCK"])
z==clf.predict(test[features])
Out[296]: array([ True, False, False, ..., False, False, False], dtype=bool)
これはうまくいきました。私は今まで知らなかった。 :) –