2016-11-01 20 views

答えて

1

平均値をデータから差し引くのは、固有値が行うことであるPCAを実行する標準的なステップです。

簡単に言うと、PCAはデータ(face_img)を直交ベースに投影するアルゴリズムです。次に、この基底から最小の固有値を取り除き、その固有値に関連付けられた上位k個の固有ベクトルを返します(k < n、元のデータの次元数)。線形代数は、これらの上位k次元が線形部分空間にデータを投影するための「最良のk次元」であることを示しています。 最高は「最も分散を説明する」と定義されています。これはPCAの次元削減マジックです。 PCAの詳細については、https://stats.stackexchange.com/を検索することをお勧めします。

固有値は、データの共分散行列のSpectral Decompositionface_imgを使用して求められます。共分散行列の定義に暗示されているのは、データがの平均中心であることです。です。すなわち、データの平均がデータから減算される。従ってface_difference = face_img - mean_face。ほとんどの(すべてではないにしろ)ソフトウェアパッケージはこれをPCAの機能に組み込んでいますが、最初に確認することをお勧めします。