2017-05-28 12 views
0

これは私が持っている試験課題です。私は200x6の行列を持っていて、200人が連続した[0,1]スケール(0:不一致、1:同意)でそれぞれ6つの質問に関して映画を投票したとします。 6次元データセットの有用な概要を得るには、データのランク2近似をプロットする必要があります。私は「*」で2D散布図としてこの近似をプロットしたい中間座標のMatlabプロット散布図

A = (200, 6); %some data 
[U, S, V] = svd(A); 
Ak = U(:, 1:2) * S(1:2, 1:2) * V(:, 1:2)'; 

- UまたはVのいずれかを使用して、調査参加者ごとのマークは、私のデータがどのように応じて、中間座標として座標:まず、私はランク2の近似を行います問題は、中間座標がどういう意味なのか分からず、どこでも良い説明を見つけることができないということです。誰かが助けてくれるかと思ったら、結局は小さなコードの例を提供してください。何か助けていただきありがとうございます。

答えて

0

正式には、中間軸は、(最大の説明された分散に沿って、主成分としてa.k.a.となるように)データの線形結合(ortogonal)です。

データの大部分が類似の形状([5 4 3 2 1 0]パターンなど)の場合、最初のコンポーネントはこの形状/ベクトルに似ています。これは、分散が最小である(または、最大です)。次のコンポーネントは、直交面内の残りの分散を最小限に抑えます。

したがって、答えは主成分1と2です。

より正確には、第1中間座標値は、単一のデータサンプルにおけるその「第1主パターン」の大きさとして理解することができる。