2017-11-25 18 views
0

CHAIDを使用してモデルを構築しました。CHAIDで予測を行うR

MA_CHAID <- chaid(Data$target 
       ~ Data$factor1 
       + Data$factor2, 
       control = chaid_control(minprob = 0.001, 
             minsplit = 500,minbucket = 200), 
       data = Data 
       ) 

Data$MA_predict <- predict(MA_CHAID, Data) 

しかし、私は、このエラーメッセージを取得:

Error in `$<-.data.frame`(`*tmp*`, MA_predict, value = c(1L, 1L, : 
replacement has 124855 rows, data has 379031 

任意のアイデアを(私は木でそれを行うだろうように)またはRPART() - 今私は、変数を予測するためにそれを使用したいですか?

ありがとうございます!

答えて

0

CHAIDツリーは、欠損値を持つ予測子を含むビルドでした。

アルゴリズムは、欠損値を持つすべての行を除外しました。なぜモデルがケースの半分だけで構築されたのか

私の次の試みは、それ自身のカテゴリとして「欠落」を使用することです。