2016-01-05 2 views
7

Random Forestsdocumentationには機能が含まれていません。ただし、Jiraに記載されており、source codeに記載されています。 HEREも「このAPIの主な違いを言うと、元MLlibはAPIをアンサンブルは、以下のとおりです。データフレームとMLパイプライン Sparkの機能の重要性をランダムフォレストでどのように使うのですか?

  • 連続区別するために、データフレームのメタデータの回帰
  • 使用対分類の分離のための

    • サポートとランダムな森林のためのカテゴリ 機能
    • より多くの機能:機能 重要の見積もりだけでなく、各クラス (の予測確率a.k.a.分類のためのクラス条件付き確率)。」

    しかし、私はこの新機能を呼び出すために働くの構文を理解することはできません。

    scala> model 
    res13: org.apache.spark.mllib.tree.model.RandomForestModel = 
    TreeEnsembleModel classifier with 10 trees 
    
    scala> model.featureImportances 
    <console>:60: error: value featureImportances is not a member of org.apache.spark.mllib.tree.model.RandomForestModel 
           model.featureImportances 
    
  • 答えて

    3

    あなたは新しいランダムフォレストを使用する必要があります。あなたの輸入を確認してください。 オールド:NEWランダムフォレストを使用

    import org.apache.spark.mllib.tree.RandomForest 
    import org.apache.spark.mllib.tree.model.RandomForestModel 
    

    import org.apache.spark.ml.classification.RandomForestClassificationModel 
    import org.apache.spark.ml.classification.RandomForestClassifier 
    
    +0

    新しいインポート(RandomForestClassificationModel) - どのようにモデルを訓練しますか? @Climbs_lika_Spyder – Yaeli778

    +1

    @ Yaeli778、https://spark.apache.org/docs/1.5.2/ml-ensembles.html –

    +0

    でモデルをトレーニングする方法の良い例があります。フィーチャーの重要な部分を取得する方法を指摘できますかpyspark? – pseudocode

    関連する問題