私はRandomForest.featureImportances
を使用していますが、出力結果がわかりません。スパークランダムフォレストの特徴理解結果結果
私には12の機能がありますが、これは私が得られる出力です。
これはapache-spark固有の質問ではないかもしれませんが、出力を説明する場所を見つけることができません。木のアンサンブルモデルを考える
// org.apache.spark.mllib.linalg.Vector = (12,[0,1,2,3,4,5,6,7,8,9,10,11],
[0.1956128039688559,0.06863606797951556,0.11302128590305296,0.091986700351889,0.03430651625283274,0.05975817050022879,0.06929766152519388,0.052654922125615934,0.06437052114945474,0.1601713590349946,0.0324327322375338,0.057751258970832206])
詳細なグレート、一つは、これは、このメタデータのJSON構造である
などの機能の入力ベクトルのメタデータを取得することができます答え、ありがとう!私はマルチクラスの分類を行っています - 4つのクラス、各クラスの特徴の重要度を計算する方法がありますか? – other15
それは今のようには思われません。 – eliasah
@ other15、私の最初の考えは、あなたの4つのクラスのそれぞれについてバイナリクラシファイアをトレーニングすることです。それでは、それぞれに特徴のあるものがあります。アイデアではない、わかっているが、うまくいくはずだ。 –