2017-08-07 6 views
0

誰かが、setThresholds()機能の目的がApache Gradient Boosted TreesとApache Sparkのランダムフォレストについて私に説明することはできますか?公式のApache SparkのWebサイトには、その機能が使用されているドキュメントや例はありません。私が自分の目的に使用できるかどうかを知りたいと思っています。この機能はツリーが行う内部決定にしきい値を設定しますか?たとえば、数値列の場合、setThresholds(5.0)を使用すると、if(column < 5.0)と等価です。または私は間違っていますか?ディシジョンツリーにしきい値を設定しますか?

答えて

2

documentationの右側の部分を確認していないようです。

thresholds値は、以下のように定義される:しきい値ため

のParamを各クラスを予測する確率を調整する多クラス分類に。配列は、値が> 0であるクラスの数に等しい長さを持たなければならない。最大値p/tを有するクラスが予測される。ここで、pはそのクラスの元の確率であり、tはクラスの閾値である。

そして、あなたはそれが複数とだけではなく、一つの閾値で実際にしきい値だ気づきました。

setThresholds(foo)を使用してしきい値を設定できます。ここで、fooはしきい値の値です。

+0

ここには表示されません。http://spark.apache.org/docs/latest/api/java/org/apache/spark/ml/classification/GBTClassifier.html#getThresholds-- –

+0

すべてのサポートがScalaまたはPythonにのみ提供され、Javaでは提供されない場合ほとんどのメソッドは、Java API Documentation –

+0

で実際には説明されていません。私は前にそれに気づいていない。私は単にJava APIを使用しない – eliasah

関連する問題