カテゴリ分類データのモデリング：ダミーまたは要因

私は異なる共変量を推定するためにcoxphモデルを使用しています。私は関数が範疇変数をどのように処理するかを本当に困惑しているカテゴリ分類データのモデリング：ダミーまたは要因

Boston=1 

NY=2 

MIAMI=3 

LA=4

：私のモデルで

一つの共変量はLOCATIONと呼ばれる範疇変数、四つの状態を持つことができ、具体的geograpical 1、です。 KleinとMoeschberger（2005）は、本の「Survial Analysis ..」に書いているように、カテゴリをダミーとみなすべきだと書いています。したがって、私は3つのダミー変数クリートう：NY、マイアミやLA、BOSTONはreferrenceグループになり、私のモデルは、次のようになります。

coxph(surv(start,event)~NY+MIAMI+LA, data=FNMA) （ダミーモデル）

このモデルが正しいとすれば、関数はボストンがその場合のリファレンスグループであることを自動的に認識する必要があるので、本当に不思議です。

一方、私は一度一つは単に因子としてLOCATION変数を変換することができることを読み出す：

coxph(surv(start,event)~factor(LOCATION), data=FNMA) （因子モデル）

第二のモデルは、正直私には多くの意味がありますが、私は、参照本が1でのようなものは、それを扱うべきであると述べたので、私は本当に困惑している（たぶん本は古いですか？）

どのモデルが正しいですか？

おかげで、

出典

2017-10-19 Kosta S.

私は一般的なルールとして、 'R'では要素を使うべきだと考えています。しかし、あなたがその注文をしたいのであれば、 'factor' argumet' levels = c（ "Boston"、 "NY"、 "Miami"、 "LA"） 'を設定する必要があります。 –

彼らはあなたに同じことを与えるべきである（少なくとも彼らは、通常の線形回帰とGLMモデルで行います）。 Rに因子を与えると、最初の因子レベルを参照レベルとして使って、「フードの下に」ダミーを作成します。

ファクタの出力には、ファクタ名が3回表示されています。わずかに変更されて、参照するレベルが示されます。

出典

2017-10-19 14:41:37

カテゴリ分類データのモデリング：ダミーまたは要因

答えて

関連する問題