2016-11-04 8 views
1

私はrでgbmを使って生存率を予測しています(distribution = "coxph")。GBM in coxph loss関数

gbm.predict(....、type = "response")の予測値は、おおよそ[​​-0.001〜0.5]の範囲です。

0から1までのリスク([0,1])を持たずに新しいサンプルのリスクをどのように解釈できますか?

答えて

0

bazehaz.gbmを見ると、gbm.predictがlambda_0(t)を与えることがわかります。

The proportional hazard model assumes h(t|x)=lambda(t)*exp(f(x)). 
gbm can estimate the f(x) component via partial likelihood. 
After estimating f(x), basehaz.gbm can compute the a nonparametric estimate of lambda(t). 

だからあなたは(私は願っています)このように行くことができます:あなたは生存関数を探しているなら..私はそれに取り組んでいます

model = gbm(Surv(durata, status2015) ~ .-fold, data= ...) 
XB =predict.gbm(model, n.trees = ..., type = "response") 

lambda0 = basehaz.gbm(t = data$time, delta = data$censoring, t.eval = sort(unique(data$time)), cumulative = FALSE, f.x = XB , smooth=T) 
XBnew =predict.gbm(model, n.trees = ..., data=newData, type = "response") 

hazard = h(t|x)= lambda0*exp(XBnew). 

。 :)

P.S .: XB思考の推定に奇妙な振舞いがあります。なぜなら、それは木の数によって大きく変わるからです。 :(

+0

データを別々に使用してもXBとXBnewが同じ理由でアプローチを試みました – BigDataScientist