Rのgbm
パッケージを使用して分類ツリーを強化しようとしていますが、predict
関数から得られる予測の種類について少し混乱しています。Rの分類クラスを強化するR
#Load packages, set random seed
library(gbm)
set.seed(1)
#Generate random data
N<-1000
x<-rnorm(N)
y<-0.6^2*x+sqrt(1-0.6^2)*rnorm(N)
z<-rep(0,N)
for(i in 1:N){
if(x[i]-y[i]+0.2*rnorm(1)>1.0){
z[i]=1
}
}
#Create data frame
myData<-data.frame(x,y,z)
#Split data set into train and test
train<-sample(N,800,replace=FALSE)
test<-(-train)
#Boosting
boost.myData<-gbm(z~.,data=myData[train,],distribution="bernoulli",n.trees=5000,interaction.depth=4)
pred.boost<-predict(boost.myData,newdata=myData[test,],n.trees=5000,type="response")
pred.boost
pred.boost
間隔(0,1)
からの要素を持つベクトルである:
は、ここに私のコードです。
私の応答変数z
も二分値で構成されていて、私は、0
または1
のいずれかであることが予測値を期待しているだろう - 0
または1
のいずれか - と私はdistribution="bernoulli"
を使用しています。
私のテストデータセットの実際の分類を得るために私の予測をどのように進めるべきですか? pred.boost
の値を単純に丸めるか、predict
の機能に問題がありますか?