私は文章の数値感情値を予測したい言語データを回帰しています。私のデータは120x531です。私はデータが比較的疎であるように、いわゆるバッグオブワードアプローチを使用しています。RのCaretパッケージは線形モデル(lm)とランダムなフォレストを混同します
私は私のコードは、基本的にこれであるので、単純な線形回帰モデルを始めたい:
ctrl = trainControl(method="cv", number=10)
model.valence.lm = train(data[,5:531], data[,2], model = "lm", trControl = ctrl)
model.valence.lm
しかし、キャレットは、私は次の出力を得るように、(特に参照線形モデルとランダム森林を混同しているようです最初の行):これはさらに混乱私のために、私は基本的にコピーされ、以前のプロジェクトからこのコードを貼り付けるという、事実である作る何
Random Forest
120 samples
527 predictors
No pre-processing
Resampling: Cross-Validated (10 fold)
Summary of sample sizes: 108, 108, 108, 108, 108, 108, ...
Resampling results across tuning parameters:
mtry RMSE Rsquared RMSE SD Rsquared SD
2 2.594079 0.2786009 0.1236510 0.1612251
32 2.459950 0.1920956 0.1886138 0.1484976
526 2.639718 0.1028518 0.2459268 0.1067835
RMSE was used to select the optimal model using the smallest value.
The final value used for the model was mtry = 32.
(これは働いていました)。なぜこのようなことが起こるのか誰にも分かりますか?私は私のデータオブジェクトをチェックして、明らかに私が使っている機能は整数(浮動小数点数ではない)です。これは可能な説明かもしれませんか?