5

enter image description here次のxgboostモデルのツリーダイアグラムの 'leaf'の値は何を意味しますか?

私は、上記(樹枝)条件が存在することを条件に条件付き確率であると推測しています。しかし、私はそれについて明確ではない。

あなたが使用したデータや方法についての詳細を読みたい場合は、私たちは、この図は、その後に行くのですか:http://machinelearningmastery.com/visualize-gradient-boosting-decision-trees-xgboost-python/

+0

いくつかの葉に負の値がありますか? – dksahuji

答えて

0

属性leafは予測値です。言い換えれば、ツリーモデルの評価が終端ノード(別名リーフノード)で終了する場合、これが返される値です。擬似コードで

(あなたのツリーモデルの一番左のブランチは):

if(f1 < 127.5){ 
    if(f7 < 28.5){ 
    if(f5 < 45.4){ 
     return 0.167528f; 
    } else { 
     return 0.05f; 
    } 
    } 
} 
1

あなたは正しいです。リーフノードに関連付けられたそれらの確率値は、ツリーの特定のブランチを与えられたリーフノードに到達する条件付き確率を表す。木の枝は一連の規則として提示することができます。例えば、彼のanswerに記載されている@ user1808924;ツリーモデルの一番左のブランチを表す1つのルール。

したがって、ツリーは決定ルールに線形化することができます。結果はリーフノードの内容で、パスに沿った条件はif節の連結を形成します。一般的に、ルールは次の形式をとります。

if condition1 and condition2 and condition3 then outcome. 

右のターゲット変数を使用して関連付けルールを作成して、決定ルールを生成することができます。それらはまた、temporalまたはcausal関係を表すことができます。

関連する問題