2017-06-13 5 views
0

私のコードは次のとおりです。pyspark LogisticRegressionの出力では、ウィック確率はどのクラスに属していますか?次のよう

from pyspark.ml.classification import LogisticRegression 
lr = LogisticRegression(featuresCol="features", labelCol="label") 
lrm = lr.fit(transformed) 
predictions = lrm.transform(transformed) 
predictions.select('probability') 

私は2つのクラスを持っているので、これは私の2つの確率を与えます。 しかし、どの確率がどのクラスに属するのかわかりません。それを見つける方法。ありがとう

答えて

0

sparkはp> 0.5に基づいてクラスを予測します。予測データフレームから確率と予測列を選択します。データフレームの最初の行を調べて、0.5より大きい値を持つ要素を確認し、予測クラスを参照してください。例えば、要素1の値は0.56、クラス2の予測値です。確率の0番目の要素はクラス1の確率に属し、1番目の要素はクラス2です。

+0

私の出力では、すべてのレコード/行について、の確率は、予測されるクラスに関係なく常に0番目の要素よりも高い。それは第1要素が常に予測されるクラスの確率であることを意味しますか? – Ajg

関連する問題