現在、チャーン問題の予測モデルに取り組んでいます。
次のモデルを実行しようとすると、このエラーが発生します。少なくとも1つのクラスレベルが有効なR変数名ではありません。変数名がX0、X1に変換されるため、クラス確率が生成されるとエラーが発生します。有効なR変数名として使用できる因子レベルを使用してください。分類 - 因子レベルの使用
fivestats <- function(...) c(twoClassSummary(...), defaultSummary(...))
fitControl.default <- trainControl(
method = "repeatedcv"
, number = 10
, repeats = 1
, verboseIter = TRUE
, summaryFunction = fivestats
, classProbs = TRUE
, allowParallel = TRUE)
set.seed(1984)
rpartGrid <- expand.grid(cp = seq(from = 0, to = 0.1, by = 0.001))
rparttree.fit.roc <- train(
churn ~ .
, data = training.dt
, method = "rpart"
, trControl = fitControl.default
, tuneGrid = rpartGrid
, metric = 'ROC'
, maximize = TRUE
)
添付の画像に私のデータが表示されていますが、すでに一部のデータがchrからfactor変数に変換されています。
私が要因に全データを変換するならば、私はその後、例えば変数total_airtime_outはおそらく周りの9000要因を持つことになり、私の問題が何であるかを得ることはありません。
ありがとうございました!
エラーメッセージを再現できるダミーデータまたはサンプル+コード(パッケージを含む)を追加できますか?ありがとう。 – lukeA