私はこの質問を前に投稿しましたが、私は問題をうまく説明していないと思っていました。私はこれを代わりに掲示しています。これがご迷惑をおかけして申し訳ございません。R:glm(multiple linear regression)はいくつかのプレディクタ変数を無視/削除します
私はあまりにも大きなテーブルを使用していますが、例のデータを提供できないということについて事前にお詫びします。これまで私はいつも私のために働いてきました。だから、私はちょうどあなたのアイデアを問題になるものにしようとしています。しかし、もっと情報を提供できる方法があれば、教えてください。
私は、応答変数と予測変数のテーブルに対応するベクトルを持っています。応答ベクトルは数値で、予測変数(表の列)はバイナリ形式(0と1)です。
私は応答ベクトルと予測因子のテーブルを使用してGLM機能(多変量線形回帰)を実行しています:
fit <- glm(response ~ as.matrix(predictors), na.action=na.exclude)
coeff <- as.vector(coef(summary(fit))[,4])[-1]
私は過去に、私は回帰係数のベクトルを抽出することをやっているときそれをさらなる分析に使用する。
回帰は、いくつかの値が欠けている係数のベクトルを返します。本質的に、いくつかの予測変数は、glmによって係数に帰するものではない。しかし、エラーメッセージはありません。
モデルの要約は正常ですが、私が言及したようにいくつかの予測変数がありません。他のほとんどの予測変数にはデータ(係数、p値など)が割り当てられています。行方不明の予測因子は、応答ベクトルによって異なりますが、...
を、 30についての予測は、私は別の応答変数(ベクトル)を使用して試してみました200上に、モデルから欠落しているが、私は同じ問題を取得しています
何が起こっているかについてのアイデアはありますか?私はこれは、いくつかの変数に0の分散がある場合に起こると思いますが、私はそれをチェックしました。 NA値も欠損値もありません。
glmがいくつかのプレディクタ変数を無視/削除する原因は何ですか?
ご提案は大歓迎です!
編集:削除された予測子は別の予測子と同じ値を持つことがわかりました。それらを保持する方法が残っていなければならず、同じ回帰係数を得る例があります。
同じ値を持つ2つの予測変数がある場合、モデルは複数共線性に悩まされ、推定できません。モデルに適合させる前に、予測子が独立していることを確認する必要があります。 – MrFlick