2017-04-05 19 views
-4

X、Y、Zの1000 * 3 GPSプロットのデータセットがあります.XとYの完全なプロットを10度回転させます。 回転行列を使用しています https://en.wikipedia.org/wiki/Rotation_matrix#Three_dimensionsRのデータフレームを回転する方法

ただし、データセットはローテーションしていません。 ガイダンスが役に立ちます

+1

はい、次元削減のためにPCAを使用すると、* something *が失われる可能性があります。あなたは通常、ノイズを取り除くためにこれを行います。その場合、私はそれが失われた*情報*ではないと主張します。とにかく、あなたの質問を改善して、あなたが実際に何をしているかを示してください。 PCAを正しく使用する方法については、[Cross Validated](http://stats.stackexchange.com/)にお問い合わせください。 – kazemakase

答えて

0

正規化は、予測子が元のスケーリングに匹敵するものでない場合にのみ必要です。正規化する必要があるというルールはありません。

PCAは新しい線形変換をもたらす統計的方法です。それだけで、それは何も失われません。それは、あなたに新しい主成分を与えることだけです。

これらの主成分のサブセットを選択した場合にのみ情報が失われます。

0

通常、PCAには前処理ステップとしてデータのセンタリングが含まれています。

PCAは、独自のAxis(Eigne Vectors)システムでのみデータを配置します。
すべての軸を使用すると情報が失われます。

通常、私たちは直観的に、データの座標が少ないDimensionality Reductionを適用したいと考えています。
このプロセスは、データの一部の固有ベクトルだけにまたがるサブスペースにデータを投影することを意味します。
ベクトルの数を賢明に選択すると、データ/情報の損失が無視できる程度にデータの次元数が大幅に減少する可能性があります。
そうする方法は、固有値がデータパワーの大部分と合わされたEigen Vectorsを選択することです。

0

PCA自体が可逆です。ロスレスです。

しかし:

  1. 情報の損失を引き起こすであろう、いくつかのコンポーネントをドロップするのが一般的です。
  2. 数値的な問題は、精度の低下を引き起こす可能性があります。
関連する問題