私はサブスクリプションの顧客寿命をモデル化しようとしています。データが検閲されているので、私はRの生存パッケージを使用して生存曲線を作成します。Rの生存モデルに打ち切りデータを入力するにはどうすればよいですか?
オリジナルのサブスクリプションデータセットは、このようになります..私はこのように見えるように操作し
id start_date end_date
1 2013-06-01 2013-08-25
2 2013-06-01 NA
3 2013-08-01 2013-09-12
..
id tenure_in_months status(1=cancelled, 0=active)
1 2 1
2 ? 0
3 1 1
生存モデル供給するため..in:
obj <- with(subscriptions, Surv(time=tenure_in_months, event=status, type="right"))
fit <- survfit(obj~1, data=subscriptions)
plot(fit)
を
consureの場合のtenure_in_months変数には何を書きますか?すなわち、定期購読は今日でも有効です - 今日までの在任期間か、それともNAでなければならないのでしょうか?
あなたのデータを収集した日までは、それは "今日"だと思います。 – drevicko