2016-09-23 3 views
0

グラデーションブースティングやランダムフォレストを使用してモデルを実行するように求められました。しかし、これまでのところ、変数の重要度の観点から戻ってくる唯一の出力は、変数が分岐ルールとして使用された回数に基づいています。基本的に係数を取得するか、変数がターゲットに及ぼす影響を何らかの形で数値化するように求められました。 グラデーションブースティングモデルでこれを行う方法はありますか?私の他の考えは、通常の意思決定ツリーやGLMや正規回帰モデルにおいて、支店ルールとして訴えられた変数のみを使用することでした。グラディエントブーストで独立変数の影響を定量化する方法はありますか?

ご了承ください。本当にありがとう!

答えて

0

誤解がないことを確認するだけです。SA​​Sはデシジョンツリー/グラジエントブースト(少なくともEMで)ではスプリットベースの変数重要度を使用しています。

スプリットベースの重要性は、分割数をカウントしません。 これは、モデル内のすべての分割によって達成された二乗和の縮小に関連して、1つの変数(この変数によるすべての分割にわたる合計)による2乗和の比の比率です。

サロゲート・ルールを使用している場合、相関の高い変数はおおよそ同じ値を受け取ります。

+0

ありがとうございます! – jswtraveler

関連する問題