Sparkの機能の重要性をランダムフォレストでどのように使うのですか？

Random Forestsのdocumentationには機能が含まれていません。ただし、Jiraに記載されており、source codeに記載されています。 HEREも「このAPIの主な違いを言うと、元MLlibはAPIをアンサンブルは、以下のとおりです。データフレームとMLパイプライン Sparkの機能の重要性をランダムフォレストでどのように使うのですか？

連続区別するために、データフレームのメタデータの回帰

使用対分類の分離のための

サポートとランダムな森林のためのカテゴリ機能
より多くの機能：機能重要の見積もりだけでなく、各クラス（の予測確率a.k.a.分類のためのクラス条件付き確率）。」

しかし、私はこの新機能を呼び出すために働くの構文を理解することはできません。

scala> model 
res13: org.apache.spark.mllib.tree.model.RandomForestModel = 
TreeEnsembleModel classifier with 10 trees 

scala> model.featureImportances 
<console>:60: error: value featureImportances is not a member of org.apache.spark.mllib.tree.model.RandomForestModel 
       model.featureImportances

出典

2016-01-05 Climbs_lika_Spyder

あなたは新しいランダムフォレストを使用する必要があります。あなたの輸入を確認してください。オールド：NEWランダムフォレストを使用

import org.apache.spark.mllib.tree.RandomForest 
import org.apache.spark.mllib.tree.model.RandomForestModel

：

import org.apache.spark.ml.classification.RandomForestClassificationModel 
import org.apache.spark.ml.classification.RandomForestClassifier

出典

2016-01-05 22:33:34

新しいインポート（RandomForestClassificationModel） - どのようにモデルを訓練しますか？ @Climbs_lika_Spyder – Yaeli778

@ Yaeli778、https://spark.apache.org/docs/1.5.2/ml-ensembles.html –

でモデルをトレーニングする方法の良い例があります。フィーチャーの重要な部分を取得する方法を指摘できますかpyspark？ – pseudocode

Sparkの機能の重要性をランダムフォレストでどのように使うのですか？

答えて

関連する問題