2
spark(scala api)でxgboostを使用しています。Sparkのxgboostで無効な確率
val params = List("eta" -> "0.1", "max_depth" -> "2",
"silent" -> "1", "objective" -> "binary:logistic").toMap
XGBoost.train(trainRDD, params, 10, 10)
次に、2つのpredict
のスコアリング機能が用意されています。 DMatrix
をとり、ドライバー(ローカル)で動作し、RDD[Vector]
を受け取り、分散モードで動作するもの。
同じテストデータセットの場合、これら2つの関数は異なる値を返します。ローカルで動作するものは、-1.23または1.34のような値を返しますが、もう一方は0.21または0.71を返します。 2番目のものは0と1の間の確率を返しますが、最初のものは他のものを返します。
誰かがこれについて詳しく説明できますか?