2012-04-22 8 views
1

私のデータフレームの4つの列について、princomp分析を行い、最初の構成要素が他の3つの構成要素よりも圧倒的に重要であることがわかりました。主成分分析後に線形モデルを適合させる方法

最初のコンポーネントのみを使用して線形モデルに適合したいと思います。このコンポーネントだけで構成された新しいデータを取得するにはどうすればよいですか?

いくつかの行列乗算が含まれていることを理解していますが、これを行う方法はわかりません。私はグーグルとグーグルで、理解できるものは何も見つかりません。

+1

最初の要素は常に「最も重要」になります。パラレル分析を使用して、抽出する必要があるコンポーネントの数を判断することもできます。 PCA回帰のためのpclパッケージの 'pcr'関数もチェックしてください。(自分でこれを使ったことはありませんでしたが) –

+0

一方、他のPCの1つがあなたの応答に実際に関連しているかもしれません。回帰式で使用するために設計された次元削減の方法を使用する方が良いときは、それを実行してください。 – Aaron

答えて

3

スコアは、主成分を使用して変換されたデータです。私はprcompprincompが出力としてこれらを生成すると思います。次に、最初の列を選択します。 princompまたはprcomp?prcomp?princomp)のドキュメント、特に値のセクション(関数が返す内容について説明しています)とサンプルセクションを参照してください。

+0

彼らはどのように出力としてそれらをyeildするのですか?その列はどうすれば入手できますか?これは私が理解できないものです!私が見ることができるのは、分散への貢献という点での結果です。 –

+3

'?princomp'は、スコアが' scores'というリスト要素にあることを示しています。だから 'ans < - princomp(data、etc) 'を実行した場合、' ans $ scores [、1] 'には最初のスコアセットが含まれています(オブジェクト/サンプルごとに1つあります。 )。 'princomp'の使い方に応じて、引数' scores = TRUE'に注意してください –

関連する問題