モデルサマリーの実行時にRがどのように機能するかに関する理論的な質問があります。私は、私の変数のうちの2つが、3つのレベル、それぞれ対応する遺伝子型を持つカテゴリカルであるいくつかの線形回帰モデルを実行しています。私は、レベルのうちの2つだけがモデルの要約に表示されることを知っています。レベルの1つは参照でなければなりません。しかし、これらの変数は、線形回帰のカテゴリ変数:1つの値が1つのレベル、残りはNA
のように、レベルの1つのみに1カウントしかありません。変数1レベル:TT 176カウント/ TC 45カウント/ CC 1カウント(これは遺伝子型が223人のうちの個体)。
ここで、このCCレベルは通常モデルの要約には表示されません。それは、1つしかないため、Rには考慮されていないからです。私が必要とするのは、私の前提を確認したり拒否する文献の参考文献を見つけることだけです。私はこれをさまざまな方法でグーグルにしようとしており、lm
のR ?help
およびその他の関連する検索を行っていますが、探しているものが見つからないか、そのように理解できませんでした。
ご協力いただければ幸いです!
これらのレベルは自然な順序になっていますか?そうでない場合、回帰は変数1のCCレベルにあふれていると思います。係数の基礎となる観察は1つだけですが、回帰は平均的な行動について何かを言う「多くの」観測を含めるという考え方に基づいています –
私が思っていたこと。しかし、私はこれが本当に起こっていることを100%確信して言うことができる必要があります。そのため、私はこの現象の文献源を探しています(私は論文を準備していますので、私の結果を説明するときの私の推論)。初めてR! –