2017-02-01 7 views
0

最近、私はPCA(Principle Component Analysis)を読み、次元を縮小する方法を理解しました。 1つの次元だけが必要なときに最大固有値に対応する固有ベクトルを選択しますが、複数の次元を必要とする場合、最大固有値に腐食する固有ベクトルを取るべきですか?主成分分析を使用して複数の次元を選択する方法

答えて

1

基本的にはい(あなたの説明から推測できるものから)、あなたのケースや実装ツールなどにもっと情報を持っているといいですね。しかし、基本的には、はい、プロセスは次のようになります。

  1. 計算共分散行列共分散行列の
  2. 計算固有ベクトル、あなたのツールに応じて、それはまた、事前に定義された関数「EIG」または「特異値descompositionを用いて計算することができます。 "(matlabのsvd)。 svdを使用する場合、一般に3つの値が返されます。最初の値は固有ベクトルを含む行列で、この行列の "k"次元が必要な場合は "k"列をとり、それらは主成分です。 https://github.com/llealgt/standord_machine_learning_exercices/blob/master/machine-learning-ex7/ex7/pca.m

    https://github.com/llealgt/standord_machine_learning_exercices/blob/master/machine-learning-ex7/ex7/ex7_pca.m

は、相続人PCAのオクターブでの私の実装では、私は、その特定のケースについてdimensinality削減のためにそれを使用するために私のPCA計算とex7_pca.mを定義するためにpca.mファイルを使用します

1

主成分分析(PCA)は、可能性のある相関変数の観測値のセットを、主成分と呼ばれる線形に無関係な変数の値のセットに変換する直交変換を実行する統計的手法です。

PCA変換後のコンポーネントの数は、変数の数と同じです。この変換は、第1の主成分が可能な限り大きな変動を有するように(すなわち、できるだけデータの変動性を考慮して)定義され、各後続の構成要素は、前のコンポーネントに直交するという制約があります。得られたベクトルは、無相関直交基底集合である。

一般的に、人々は99%の分散を占める多くのコンポーネントを取ります。これは、変数の総数よりもはるかに少ないでしょう。

参考文献:

https://stats.stackexchange.com/a/140579/86202

http://scikit-learn.org/stable/modules/decomposition.html#pca

https://en.wikipedia.org/wiki/Principal_component_analysis

関連する問題