2016-11-24 9 views
2

気象データ(温度、圧力、湿度など)、X、Y、Zは次元数(nxp)の行列です。ここで、nは観測数、 pは空間点の数です。複数のデータセットに対するPCA(Principle Component Analysis)

以前は、データセットXの変動のモードを調べるために、私は単に経験的直交関数(EOF)分析や主成分分析(PCA)は、Xにこれは(SVDを介して)分解関与し、行列X

を行います

XとYの可変性のモードの結合を調べるために、私はXY^{T}に比例する共分散行列を分解する最大共分散分析(MCA)を使用しました。 (Tは転置)

しかし、私は3つのデータセットすべてを見たいと思ったらどうすればいいですか?私の行列Lを有するように、

L = [X、Y、Z]

:私が持っていた一つのアイデアは、3つのデータセットの「機能」連結されます第四行列、Lを形成するようにしました寸法(nx 3p)。

次に、標準的なPCA/EOF分析を使用し、SVDを使用してこの行列Lを分解し、次にサイズ(3p×1)の可変モードを取得し、その後Xに関連付けられたモードが最初のp値であり、 Yに関連するモードはp値の第2のセットであり、Zに関連するモードは最後のp値である。

これは間違いありませんか?あるいは、誰も3つ(またはそれ以上)のデータセットの結合を調べる良い方法を提案できますか?

ありがとうございました!

答えて

1

私は空間的な点を余分な次元、すなわちf x n x pとして扱うことをお勧めします。ここで 'f'はフィーチャの数です。この時点でテンソルデータを処理できるmultilinear extension of PCAを使用してください。

関連する問題