2016-08-30 18 views
1

RでrandomForestアルゴリズムを実装し、sparkR(Apache Spark 2.0.0以降)を使用して同じアルゴリズムを実装しようとしました。 SparkRのRandomForestアルゴリズム?

は、しかし、私は https://www.codementor.io/spark/tutorial/linear-models-apache-spark-1-5-uses-present-limitations

sparkR にのみ線形モデルGLMのような関数()の実装を発見し、任意のランダムフォレスト(ディシジョン・ツリー・アルゴリズム)の例を見つけることができませんでした。 SparkのMLLibにはRandomForestがありますが、MLLibのRバインディングも見つけられません。

SparkR(2.0.0)がRandomForestをサポートしているかどうかを教えてください。そうでなければSparkRをMLlibと接続してRandomForestを使うことは可能ですか? SparkRを使用してこれを達成するにはどうすればよいですか?

答えて

1

真実は、今のところSparkRでは利用できません。 可能なオプションは、分散したデータのまとまりにランダムなフォレストを作成し、その後ツリーを結合することです。 とにかく、ランダム性に関するすべてです。

良いリンク:それは以降で利用可能となっているhttps://groups.google.com/forum/#!topic/sparkr-dev/3N6LK7k4NB0

+0

:https://spark.apache.org/docs/2.1.0/api/R/spark.randomForest.html –