2016-12-09 12 views
0

私はrandomforestを使用して、21個の変数の600行のトレーニングセットを分析しています。ランダムフォレストがerr.rateを生成しない

# Construct Random Forest Model 
rfmodel <- randomForest(default ~ ., 
        data = train.df, 
        ntree = 500, 
        mtry = 4, 
        importance = TRUE, 
        LocalImp = TRUE, 
        replace = FALSE) 
print(rfmodel) 

これには、次を生成します。

> rfmodel <- randomForest(default ~ ., 
+ data = train.df, 
+ ntree = 500, 
+ mtry = 4, 
+ importance = TRUE, 
+ LocalImp = TRUE, 
+ replace = FALSE) 

> Warning message: 
> In randomForest.default(m, y, ...) : 
> The response has five or fewer unique values. Are you sure you want to do 
> regression? 

> print(rfmodel) 

>Call: 
randomForest(formula = default ~ ., data = train.df, ntree = 500,  mtry = 4, importance = TRUE, LocalImp = TRUE, replace = FALSE) 
      Type of random forest: regression 
       Number of trees: 500 
No. of variables tried at each split: 4 

     Mean of squared residuals: 0.1577596 
       % Var explained: 23.89 

これは、何らかの理由で混同行列が不足しています。私はerr.rateを生成しようとすると、それは私にこれを与える:

ヘッド(rfmodel $ err.rate)
NULL

+0

私の質問は、ここで間違っていますか?私はOOBと0と1の混同行列を観測可能な変数である "デフォルト"に基づいて必要とします。 – user7273726

+0

コメントを質問に追加しないでください - 質問を編集してください。 –

答えて

0

私はあなたが分類をしたいと思いますが、デフォルトは数値変数として扱われます。試してくださいclass(train.df$default)。実際に数値変数の場合は、RFを実行する前に係数に変換する必要があります。

+0

あなたはそうです - 私はそれをある要素に変換するべきです。ありがとうございました – user7273726

関連する問題