2017-05-18 6 views
0

兄弟姉妹の数、離乳年齢(母齢)、母親の年齢(人数)、人種、貧困、出生時の出生率の予測変数として、以下の変数とその2ウェイ相互作用を探求したいと考えています。 (肥満)と母親の喫煙(煙)。 コックス回帰の逆行除去

は、私は私のCox回帰式を作成したが、私は予測因子との2ウェイの相互作用を形成する方法がわからない:それは lmglmのためにあるよう

coxph(Surv(wmonth,chldage1)~as.factor(nsibs)+mthage+race+poverty+bweight+smoke,data=pneumon) 


final<-step(coxph(Surv(wmonth,chldage1)~(as.factor(nsibs)+mthage+race+poverty+bweight+smoke)^2,data=pneumon),direction='backward') 
+0

私は 'coxph'が'〜x * y * z'式の式を受け入れるのだろうかと思います。 –

+0

'help(" formula ")'を学んでください。私があなたを正しく理解すれば、RHSを '(...)^ 2'で包みたいと思う。 – Roland

+0

@Rolandまったく同じですが、私はどのようにわかりません –

答えて

1

式インタフェースはcoxphでも同じです。私はそこにあるとは思わない

coxph(Surv(wmonth,chldage1) ~ 
      (as.factor(nsibs)+mthage+race+poverty+bweight+smoke)^2, 
     data=pneumon) 

:あなたはすべての双方向の相互作用を形成する必要がある場合は、共変量の「合計」の最初の引数と2の第二引数で^演算子はを使用しますCox回帰step降圧機能。 Thereauは、プロセスを自動化しやすくするために過去に話していました。 Rolandがコメントで述べたように、R Coreのパッケージ作成者の間では、段階的な手順が統計的に疑わしいとの主張があります。 (これは、人がSPSSやSASからRにクロスオーバして階段状手続きをより受け入れ、社会科学の統計コースがその方法を支持しているような場合に、カルチャーショックを引き起こすことが多い)

まずはそのような複雑なモデルをサポートするのに十分なイベントがデータにあるかどうかという疑問に対処してください。 Coxモデルの統計力は、危険にさらされている被験者の数ではなく、イベントの数によって駆動されます。確かに不完全な経験則は、各共変量に対して10-15事象が必要であり、相互作用をおそらく10倍に拡大することによって、必要な事象数を同様の因子で拡大することである。

HarrellはRMSブックとrmsパッケージのドキュメントでこのような問題について議論しており、選択方法の過程で共変量推定値に縮小を適用することを支持しています。それは、より統計的に原理的な道をたどるだろう。

あなたがそのような大きなデータセットを持っていて、どの共変量相互作用が重要である可能性が高いかについてのあなたの研究ドメインに理論がない場合は、完全な相互作用モデルを調べてから、モデルの各変更には、プロセス全体の自由度が加わります。私は過去にこのような状況に直面していました(何千万という出来事、何百万という危険にさらされています)。私のアプローチは、より厳しい統計学の理論を満たした相互作用を維持することでした。私はこのアプローチを、関連すると考えられていた変数のグループに限定しました。最初に彼らの双方向相関を調べました。私のモデルでは、喫煙や性別、5つの連続共変量を除いて私のモデルにカテゴリ変数はなく、デルタ逸脱(カイ二乗統計として分布)の測定値が30以上の双方向の相互作用を維持しました。私は暗黙の自由度が純粋なソフトウェアのリストよりはるかに高い「重要性を達成した」相互作用を保持していました。私はまた、削除された相互作用の有無にかかわらず、保持された共変量相互作用の結果を比較して、プロセスが予測された効果の大きさを有意にシフトさせなかったことを確認した。また、Harrellのrms-packageの検証と較正手順も使用しました。