2016-07-26 4 views
1

質問非常に明白なように聞こえるかもしれませんが、私は答えを見つけるために多くの検索を行いましたが、完全な証明解決を得ることはできません。スパークML確率指標マッピングへのナイーブベイクラス

私はSpark MLパッケージを使用していますが、Naive Bayesを実行した後、確率の適切な結果を得ていますが、特定のクラス値を確率インデックスとマッピングする方法を見つけることはできません(どのインデックスがどのクラス値はラベル列からですが、私はプログラム的なやり方が必要です。何らかの方法があります。ラベルcolのクラスの中で、最も発生するクラスがインデックス0などを持つことがわかりましたが、複数のクラスが同じ数出現)

enter image description here

答えて

0

一つの方法は、それを行うには:

val firstResult = resultsDataFrame.select($"probability", $"prediction").first() 
val probabilityVector = firstResult(0).asInstanceOf[Vector] 
val prediction = firstResult(1).asInstanceOf[Double] 
val probabilityIndex = if ((probabilityVector(0) < 0.5 && prediction == 0) || (probabilityVector(0) > 0.5 && prediction == 1)) 0 else 1 

あなたが探しているのは確率指標

関連する問題