2017-01-12 1 views
0

私は約50のサイトと数百の種でいくつかの生態系データのCCAを運用しています。私はあなたの説明変数の数があなたのサンプル数に近づくときに注意する必要があることを知っています。私は23の説明変数を持っているので、これは私にとっては問題ではありませんが、あまりにも多くの説明変数を使用すると、CCAを「制限解除」することができます。どのように多くの変数がCCAのためにあまりにも多いのかを決定しますか?

いくつの説明変数が適切であるかについてのガイドラインはありますか?これまでのところ、私はそれらをすべてプロットして、冗長であると思われるものを削除しました(私に8を残す)。これを通知/正当化するためにテルティア値を使用することはできますか?

おかげ

答えて

2

これは、「どのように多くの変数が回帰分析のためにあまりにも多くのですか?」尋ねると同じ質問です。 「ほぼ同じ」ではなく、まったく同じである:CCAは、線形回帰の適合値の整理である。ほとんどの重症の場合、過度にフィットする可能性があります。 CCAでは、CCAと(拘束されていない)CAの最初の固有値がほぼ同じであり、1次次元で類似が見える場合(Procrustes分析を使用してこれを確認できます)、これは明らかです。極端なケースでは、残差が消えることになりますが、アライメントでは一次次元に焦点を当てるので、後に制約のある軸や残差よりもずっと早く失われる可能性があります。さらに重要なことは、CCAを一種の回帰分析と見なす必要があり、回帰の説明変数(独立変数)と同じ態度をとる必要があります。あなたが研究する前の仮説がない場合、回帰分析のモデル選択と多変量整理の問題のすべての問題がありますが、これはstackoverflow以外のどこかで扱うべき非技術的な問題です。

+1

サンプルサイズに対する小さなコメント:サンプルサイズは〜50回です。種の数は関係ありません。あなたは50の観測のサンプルに23の説明変数で回帰を当てはめますか?ほとんど。あなたは50点に8つの説明変数で回帰を適合させますか?私は知らないが、あなたはすべきではない。あなたが必要とする制約の数を考慮するとき、これらの言葉で考える。 –

関連する問題