モデル予測と実際の値を比較する混乱行列を作成するのが難しいです。私のデータセットには159の説明変数があり、私の目標は「クラス」と呼ばれています。私はそれをしながら、5列の行列だ、それは関数が生成予測することpred1変数とは何かを持っているかもしれないと思う決定木モデルの混同行列を作成する方法
Error in confusionMatrix.default(validation$classe, pred1) :
The data must contain some levels that overlap the reference.
:次のエラーメッセージが上記のコードから生成され
#Load Data
df <- read.csv("https://d396qusza40orc.cloudfront.net/predmachlearn/pml-training.csv", na.strings=c("NA","#DIV/0!",""))
#Split into training and validation
index <- createDataPartition(df$classe, times=1, p=0.5)[[1]]
training <- df[index, ]
validation <- df[-index, ]
#Model
decisionTreeModel <- rpart(classe ~ ., data=training, method="class", cp =0.5)
#Predict
pred1 <- predict(decisionTreeModel, validation)
#Check model performance
confusionMatrix(validation$classe, pred1)
バリデーション$ classeは5段階の要素です。どのようにこれを解決するための任意のアイデアですか?事前
「validation $ classe」と「pred1」が要因であるかどうか、それらが同じレベルを共有しているかどうかをチェックする必要があります( 'level(validation $ classe)'と 'levels(pred1)')を使用して、結果をその質問に共有することができます。さらに、csvファイルからデータのサンプルを共有すると良いでしょう。 –