私は目標変数として利益を、そして約100の異なる予測変数(バイナリ、連続、ある種の文字)を持つデータセットを持っています。意思決定ツリーを使用して利益のような連続変数を最大化する
利益が最大化された(そして、好ましくは> 0)バケット(またはエンドノード)を与えるRにデシジョンツリーパッケージがありますか?
現在私はpartykitパッケージのctreeを使用しています。常に分割されたツリーは予測変数を良好に分割しますが、エンドノードは常にマイナスの利益をもたらします。
また、ノードの終わりに結果を理解することも困難です。これらは 'N ='と 'Error ='の傾向があります。代わりに '利益='を得るための方法がありますか?それであなたは最良のエンドノードが何であるかを見ることができますか?
多くのおかげで、最初の
理想的には、5つの属性の特定の変数が分割されている場合のシナリオが必要です。意思決定ツリーは、各順列の利益を合計し、合計利益の差が最大の2つのバケットに分割します。これを行う関数はありますか? – Tammboy
そして、各変数をループして、最大の利益差異を持つ変数を見つけます。次に、node1 ... – Tammboy
これは信頼性の高い回答のためにより正確に定式化する必要があります。標準的な回帰木はあなたがしたいことに非常に近いかもしれませんが、それは非常に異なっているかもしれません。現時点ではわかりません。 –