2016-09-28 2 views
0

私の質問は完全に意味をなさないとはかなり確信していますが、「rpart」を使ってRで分類ツリーを作成しようとしています。「rpart」を使用して〜記号の前に複数の変数を持つ式を作成する

fit <- rpart(success ~ A + B + C) 

「成功」は別の「価値」によっても測定される可能性があります。これさえ可能です - ただ不思議そう

Error in plot.rpart(fit, uniform = TRUE, main = "Success plot") : 
fit is not a tree, just a root 

:だから私はそれを修正するつもりだった。

fit <- rpart(success + new_option ~ A + B + C) 

しかし、私はこれらの行を実行すると:

plot(fit, uniform=TRUE, main="Success plot") 
text(fit, use.n = TRUE, all=TRUE, cex=.8) 
post(fit, file = "tree.ps", title="Success plot")  

私はこのエラーを取得します?それとも全く違う方法でこれに取り組む必要がありますか?

ありがとうございます!

+0

1つの応答変数に対してのみモデル化することができます。これを可能にする意味のある方法で 'success'と' new_option'を組み合わせることができます。 – mtoto

+0

ディシジョンツリーを単一の応答変数に合わせようとすると、rpartコントロールでth cpパラメータを使用してより深い(より複雑な)ツリー(cpの小さな値を選択します(例:cp = 0.01))を作成できます。 –

+0

mtotoとsandipan - アドバイスいただきありがとうございます。乾杯! – dsnOwhiskey

答えて

1

これは、ツリーアルゴリズムが分割を作成していないことを意味します。 cpパラメータを使用すると、ツリーの複雑さを増やすことができます。 cpのデフォルト値は0.01なので、0.001を試すことができます。しかし、これはあなたのモデルがあまりにもフィットしていることを意味するかもしれないことに注意してください。

p.s ..応答変数はvar1 + var 2でなくてもかまいません。両方を結合する必要がある場合は、モデリング関数に挿入する前に行う必要があります。

+0

ありがとう! 0.001を試して、より多くのブランチを作成しました。また、簡単なif文に基づいて新しい変数を作成することになりました。乾杯! – dsnOwhiskey

関連する問題