2017-07-26 8 views
0

複数回帰モデルのマルチ共線性をテストするためにエイリアス関数の出力を解釈するのに役立つ人がいますか?モデル内のいくつかのプレディクタ変数が高い相関関係にあることがわかっています。エイリアステーブルを使用して変数を識別したいと思います。エイリアステーブルを解釈するR

Model : 
Score ~ Comments + Pros + Cons + Advice + Response + Value + Recommendation 
+ 6Months + 12Months + 2Years + 3Years + Daily + Weekly + Monthly 

Complete : 
      (Intercept) Comments Pros Cons Advice Response Value1 
UseMonthly1  0   0 0 0 0  0   0     
      Recommendation1 6Months1 12Months1 2Years1 
UseMonthly1 0    1  1  1    
      3Years1 Daily1 Weekly1 
UseMonthly1 1   -1  -1  

値、勧告、6ヶ月、12ヶ月は、2年は、3年、毎日、毎週、毎月のバイナリカテゴリ変数です。
スコア、コメント、長所、短所、助言、および応答は数値変数です。

UseMonthlyは6Months、12Months、2Years、3Years、Daily、Weeklyと高い相関性を持つと仮定できますか?エイリアス出力の1と-1の値の違いは何ですか?それは正と負の相関ですか?

答えて

0

「完全」マトリックスの非ゼロエントリは、これらの用語がUseMonthlyに線形依存することを示しています。これは相関が高いことを意味しますが、項はリニアに依存することなく高度に相関する可能性があります。

相関変数を識別して削除することを目的としている場合は、UseMonthlyを削除する必要がありますが、ほかのものも削除することをお勧めします。多重共線性に関して問題となり得る変数を特定する一般的な方法は、大きな分散インフレ因子(例えば、car::vifによって計算される)を検索することである。