pca

3熱

1答えて

私はPCAをやっていますが、私は元の機能が最も重要であることに興味があります。私は一例でこれを説明してみましょう： import numpy as np from sklearn.decomposition import PCA X = np.array([[1,-1, -1,-1], [1,-2, -1,-1], [1,-3, -2,-1], [1,1, 1,-1], [1,2,1,-1],

0熱

1答えて

PCA値を持つK最近傍分類器を構築する

初心者データ科学ここに。私は高次元のデータセットを持っています。 2308の寸法を持つ83のサンプルがあり、その形状は（83,2308）である。さらに、長さ83のサンプルタイプの配列を持ち、その形状は（83、）です。私は元のデータセットのサブセットでKNNクラシファイア（2人の隣人）を訓練し、それを使って残りのデータポイントのサンプルタイプ（テストサブセット）を予測しようとしています。私の訓練

0熱

1答えて

PCA K-平均クラスタリング前

私は、特徴ベクトルにPCAを適用し、その後、私は、次のように、クラスタリングを行う場合は、次の reduced_data = PCA(n_components=2).fit_transform(data) kmeans = KMeans(init='k-means++', n_clusters=n_digits, n_init=10) kmeans.fit(reduced_data) 縮小

0熱

1答えて

対応PCA間の主成分と元の変数

私は今、私はちょうど数値を持つ列を取り、NaN値を落とし、だから私は持ってるためkaggleのタイタニックdataset にPCAを適用したいですよ実際には4つの変数が無視されます（「存続」）。私はPCA使用して5つのコンポーネントを取った場合、私は、この、データフレームDFにロードされています： pca_model = PCA(n_components=5) pca_model.fit(df

0熱

1答えて

kを意味する色を保存すると、進化を時間で見ることができます。

私は、クランチベースのデータセットでPCAを行って、年間の投資行動を分析しています。私はこれにRを使う。私は2000年から2012年までの間、プロットを作成しました。しかし、私がする必要があるのは、最終的に投資家（ドットで表される）が時間とともにどのように動くかを示すビデオを作成することです。私はk-meansクラスタリングを使用しており、このクラスタを色付けに使用しています。ここでは私の問題で

0熱

1答えて

各主成分の観測スコアをR

で取得しました。私は、線形回帰分析で予測子の数を減らすためにデータフレームで主成分分析を行いました。 pr.out = prcomp(df, scale=TRUE) pr.var = pr.out$sdev^2 pve = pr.var/sum(pr.var) は、私は分散の最も大きな割合を説明する最初のいくつかの主要なコンポーネントと私のデータフレームに古い変数を代用したいと思い、それを

0熱

1答えて

Julia：pcaeig（X）は "UndefVarError：fliplr not defined"を返します。

pca（主成分分析）を行う固有ベクトルを取得しようとしています。パッケージDimensionalityReduction.jlは、pcaeig（X）という非常に必要なコマンドを提供します。ここでXは行列です。 DimensionalityReduction データ= readtable（ "中期Data.csv"） T =サイズ（データ）[1] Nを使用してデータフレームをを用いは次のように私

0熱

2答えて

プロットのためのPCA変数の制限

私はデータセットのPCA解析を行っています。変数のPCAの92倍を取得しています。私はちょうど最初の2つのPCA coponentsでそれをプロットしたいと思っていました。 PCA1およびPCA2。誰もが私にこれを助けることができますか？ biplotには2つしか表示されませんか？または私は解釈と少し混乱している。もしそうなら、それは2つのコンポーネントのためだけです。次に、どのようにPCA3と