matplotlibを使ったPCAの基本例

matplotlib.mlab.PCAを使って簡単な主成分分析をしようとしましたが、クラスの属性を使って私の問題を解決することはできません。ここでは例を示します。matplotlibを使ったPCAの基本例

が2Dでいくつかのダミーデータを取得し、PCAを開始します。

from matplotlib.mlab import PCA 
import numpy as np 

N  = 1000 
xTrue = np.linspace(0,1000,N) 
yTrue = 3*xTrue 

xData = xTrue + np.random.normal(0, 100, N) 
yData = yTrue + np.random.normal(0, 100, N) 
xData = np.reshape(xData, (N, 1)) 
yData = np.reshape(yData, (N, 1)) 
data = np.hstack((xData, yData)) 
test2PCA = PCA(data)

は今、私はちょうど私の元の座標にベクトルとして主成分を取得し、私のデータの上に矢印としてそれらをプロットしたいです。

そこに行くにはすばやくクリーンな方法は何ですか？

おかげで、Tyrax

出典

2013-08-18 Tyrax

私はmlab.PCAクラスは、あなたが何をしたいのために適切であるとは思いません。このように、これは固有ベクトルになる

def center(self, x): 
    'center the data using the mean and sigma from training set a' 
    return (x - self.mu)/self.sigma

、pca.Wt：

a = self.center(a) 
U, s, Vh = np.linalg.svd(a, full_matrices=False)

center方法はsigmaによって分割：

[[-0.70710678 -0.70710678] 
[-0.70710678 0.70710678]]

特に、 PCAクラスは、固有ベクトルを求める前にデータを再スケール

これらは垂直ですが、元のデータの主軸には直接関係しません。それらはマッサージされたデータに関して主軸です。

おそらく（mlab.PCAクラスを使用せずに）あなたが直接欲しいものをコーディングする方が簡単かもしれません：

import numpy as np 
import matplotlib.pyplot as plt 

N = 1000 
xTrue = np.linspace(0, 1000, N) 
yTrue = 3 * xTrue 
xData = xTrue + np.random.normal(0, 100, N) 
yData = yTrue + np.random.normal(0, 100, N) 
xData = np.reshape(xData, (N, 1)) 
yData = np.reshape(yData, (N, 1)) 
data = np.hstack((xData, yData)) 

mu = data.mean(axis=0) 
data = data - mu 
# data = (data - mu)/data.std(axis=0) # Uncommenting this reproduces mlab.PCA results 
eigenvectors, eigenvalues, V = np.linalg.svd(data.T, full_matrices=False) 
projected_data = np.dot(data, eigenvectors) 
sigma = projected_data.std(axis=0).mean() 
print(eigenvectors) 

fig, ax = plt.subplots() 
ax.scatter(xData, yData) 
for axis in eigenvectors: 
    start, end = mu, mu + sigma * axis 
    ax.annotate(
     '', xy=end, xycoords='data', 
     xytext=start, textcoords='data', 
     arrowprops=dict(facecolor='red', width=2.0)) 
ax.set_aspect('equal') 
plt.show()

enter image description here

出典

2013-08-18 13:56:30 unutbu

素晴らしい、ありがとう。それが私が探していたものです。 – Tyrax

1.618定数の意味はなんですか？それはどこから来ますか？ – joaquin

@joaquin：そのほぼ[黄金比]（http://en.wikipedia.org/wiki/Golden_ratio）。もちろん、好きな定数を選ぶこともできますが、それはよく見えます（http://en.wikipedia.org/wiki/Golden_ratio#Painting）。 – unutbu

matplotlibを使ったPCAの基本例

答えて

関連する問題