1
私はrでgbmを使って生存率を予測しています(distribution = "coxph")。GBM in coxph loss関数
gbm.predict(....、type = "response")の予測値は、おおよそ[-0.001〜0.5]の範囲です。
0から1までのリスク([0,1])を持たずに新しいサンプルのリスクをどのように解釈できますか?
私はrでgbmを使って生存率を予測しています(distribution = "coxph")。GBM in coxph loss関数
gbm.predict(....、type = "response")の予測値は、おおよそ[-0.001〜0.5]の範囲です。
0から1までのリスク([0,1])を持たずに新しいサンプルのリスクをどのように解釈できますか?
bazehaz.gbmを見ると、gbm.predictがlambda_0(t)を与えることがわかります。
The proportional hazard model assumes h(t|x)=lambda(t)*exp(f(x)).
gbm can estimate the f(x) component via partial likelihood.
After estimating f(x), basehaz.gbm can compute the a nonparametric estimate of lambda(t).
だからあなたは(私は願っています)このように行くことができます:あなたは生存関数を探しているなら..私はそれに取り組んでいます
model = gbm(Surv(durata, status2015) ~ .-fold, data= ...)
XB =predict.gbm(model, n.trees = ..., type = "response")
lambda0 = basehaz.gbm(t = data$time, delta = data$censoring, t.eval = sort(unique(data$time)), cumulative = FALSE, f.x = XB , smooth=T)
XBnew =predict.gbm(model, n.trees = ..., data=newData, type = "response")
hazard = h(t|x)= lambda0*exp(XBnew).
。 :)
P.S .: XB思考の推定に奇妙な振舞いがあります。なぜなら、それは木の数によって大きく変わるからです。 :(
データを別々に使用してもXBとXBnewが同じ理由でアプローチを試みました – BigDataScientist