私はいくつかのツリーを印刷していますが、それらは7ページの長さです。私はデータを再調整しなければならず、それらが意味を成すかどうかを確かめるために最も頻度の高いブランチを見る必要があります。異なるクラスタのキャンセル率を特定する必要があります。CHAIDツリーを歩くR - インスタンス数でソートする必要があります
私が必要とするデータが長すぎるとすれば、最大のブランチを持つことです。そして、210個のブランチを手動で調べるのではなく、それらを検証できます。私は木がたくさんあるので、重要な結果を見るためにこれを自動化する必要があります。
例コードに使用する:
library(CHAID)
updatecars<-mtcars
updatecars$cyl<-as.factor(updatecars$cyl)
updatecars$vs<-as.factor(updatecars$vs)
updatecars$am<-as.factor(updatecars$am)
updatecars$gear<-as.factor(updatecars$gear)
plot(carsChaid)
carsChaid<-chaid(am~ cyl+vs+gear, data=updatecars)
carsChaid
このデータを印刷するとき、最初のグループのためのn = 15を参照してください。私はこの値を並べ替えることができるテーブルが必要です。
私が必要とするのは、ツリーからの各グループ内の変数値と数値を含む決定木テーブルです。これは正確にこの答えと同じではありませんWalk a tree それは番号を与えないので私はそれが方向にあると思うので。
できる人の助けを借り、
おかげで、
ジェームズ