2016-04-15 17 views
0

銀河空間の10個の主成分(5次元)と5個のサンプルを含むmydfというデータマトリックスがあります。私はすべてのPCを使ってサンプルの重心(重力中心)とその重心からの各サンプルの距離を求めます。 Rでこれをどうやって行うことができますか?例えば銀河空間の中心からの多次元距離を計算する

mydf<- structure(list(Sample = c("1", "2", "4", "5", "6"), PCA.1 = c(0.00338, 
    -0.020373, -0.019842, -0.019161, -0.019594), PCA.2 = c(0.00047, 
    -0.010116, -0.011532, -0.011582, -0.013245), PCA.3 = c(-0.008787, 
    0.001412, 0.003751, 0.00371, 0.004242), PCA.4 = c(0.011242, 0.000882, 
    -0.003662, -0.002206, -0.002449), PCA.5 = c(0.055873, -0.022664, 
    -0.014058, -0.024757, -0.020033), PCA.6 = c(-0.001511, 0.006226, 
    -0.005417, 0.000522, -0.003114), PCA.7 = c(-0.056734, -0.007418, 
    -0.01043, -0.006961, -0.006006), PCA.8 = c(0.005189, 0.008031, 
    -0.002979, 0.000743, 0.006276), PCA.9 = c(0.008169, -0.000265, 
    0.010893, 0.003233, 0.007316), PCA.10 = c(-0.000461, -0.003893, 
    0.008549, 0.005556, -0.001499)), .Names = c("Sample", "PCA.1", 
    "PCA.2", "PCA.3", "PCA.4", "PCA.5", "PCA.6", "PCA.7", "PCA.8", 
    "PCA.9", "PCA.10"), row.names = c(NA, 5L), class = "data.frame") 

、これは私が最初にすべての10件の寸法を使用して重心を見つけるために必要があるため、これらの5つのサンプルのために(明らかに2Dにおける)PCAプロットです。次に、その1重心から各サンプルの距離を計算する必要があります。

enter image description here

+0

をあなたのプロットは明らかに最初の2つの軸によって形成される平面上に10次元空間内の点の投影であることを意味しましたが、あなたの代わりにその最初の列を使用しましたそれはちょうど "サンプル"値でした。 –

答えて

1

私はポイントからの距離の二乗の合計がために最小化されるはずの5つのベクトルによって与えられた10次元の点で均等に加重大衆のためにそれを示すために、そのことは困難であろうとは思いません

> centroid = colMeans(mydf[-1]) 

> centroid 
    PCA.1  PCA.2  PCA.3  PCA.4  PCA.5  PCA.6  PCA.7  PCA.8  PCA.9  PCA.10 
-0.0151180 -0.0092010 0.0008656 0.0007614 -0.0051278 -0.0006588 -0.0175098 0.0034520 0.0058692 0.0016504 

そして、距離は次のようになります:

> rowSums(sweep(mydf[-1], 2, centroid, "-")^2) 
      1   2   3   4   5 
0.0059118459 0.0005748535 0.0003223413 0.0005664300 0.0004386126 

最初の二つの値をプロットするためのポイント「寸法は」私が代わりにこれを使用します。

with(mydf, plot(PCA.2 ~ PCA.1)) 
points(x= -0.0151180, y= -0.0092010, col='red', pch=24) 
+0

だから、あなたが実際にすべてのコンポーネントの平均からの距離を計算していますか(10 centroid)、または、セントロイドの平均(1つの銀河空間) – MAPK

+0

私は両方をやっています。 5点は10次元空間で必ず同一平面上にあったので、この状況で成功すると確信していました。私は10ポイント以上があれば成功するとは確信していませんでした。 –

関連する問題