2017-01-14 11 views
0

私はいくつかのダミー変数[0]を持つトレーニングセットを持っていますが、私はpreProc=c("center","scale")にしたくありませんが、preProc=c("center","scale")すべてのダミー変数はここ[1]のように正規化してください。したがって、中心と尺度のオプションは次のようになります。Rキャレットプレプロデータセット変数の一部とモデルを訓練

  • center:値から値を減算します。
  • スケール:値を標準偏差で割ります。

すべての非ダミー変数を使用して配列を作成し、各変数の平均とSDを計算し、すべての値を中央揃え、スケールしてから、この配列をすべてのダミーを含む別の配列に連結します変数はnew_arrayの配列になり、次にこのようなモデルを訓練しますか?またはこれはうまくいかないでしょうか?

ctrl <- trainControl(method = "repeatedcv", number=10, repeats=3) 
knn_model <- train (Class ~ ., data=new_array, method="knn", trControl=ctrl) 

:私はCrossValidatedにすでにこの質問をしてきたが、それはまたのStackOverflowと関連しているのために私は再びここでそれを頼みます。

[0] https://topepo.github.io/caret/pre-processing.html#dummy

[1] Dummy variables and preProcess

答えて

0
あなたはキャレット内のすべてのものを持ってこれを行うことができます

みましょうあなたはdata.frameが1からあなたの列を持つDFと呼ばれる持っていると言う:5それらは数値であり、6時10分は階乗です。最後に

PreProcovCenter <- preProcess(DF[,1:5]) 
preProcovDummy <- dummyVars(DF[,6:10]) 

DF[,1:5] <- predict(PreProcovCenter, DF[,1:5]) 
DFDummy <- predict(PreProcovDummy, DF[,6:10]) 

DF <- cbind(DF, DFDummy) 

と::

knn_model <- train (Class ~ ., data=DF, method="knn", trControl=ctrl) 
あなたは、次の操作を行うことができ
関連する問題