7
Random Forestsのdocumentationには機能が含まれていません。ただし、Jiraに記載されており、source codeに記載されています。 HEREも「このAPIの主な違いを言うと、元MLlibはAPIをアンサンブルは、以下のとおりです。データフレームとMLパイプライン Sparkの機能の重要性をランダムフォレストでどのように使うのですか?
- サポートとランダムな森林のためのカテゴリ 機能
- より多くの機能:機能 重要の見積もりだけでなく、各クラス (の予測確率a.k.a.分類のためのクラス条件付き確率)。」
しかし、私はこの新機能を呼び出すために働くの構文を理解することはできません。
scala> model
res13: org.apache.spark.mllib.tree.model.RandomForestModel =
TreeEnsembleModel classifier with 10 trees
scala> model.featureImportances
<console>:60: error: value featureImportances is not a member of org.apache.spark.mllib.tree.model.RandomForestModel
model.featureImportances
新しいインポート(RandomForestClassificationModel) - どのようにモデルを訓練しますか? @Climbs_lika_Spyder – Yaeli778
@ Yaeli778、https://spark.apache.org/docs/1.5.2/ml-ensembles.html –
でモデルをトレーニングする方法の良い例があります。フィーチャーの重要な部分を取得する方法を指摘できますかpyspark? – pseudocode