pca

    3

    1答えて

    私はPCAをやっていますが、私は元の機能が最も重要であることに興味があります。私は一例でこれを説明してみましょう: import numpy as np from sklearn.decomposition import PCA X = np.array([[1,-1, -1,-1], [1,-2, -1,-1], [1,-3, -2,-1], [1,1, 1,-1], [1,2,1,-1],

    0

    1答えて

    初心者データ科学ここに。 私は高次元のデータセットを持っています。 2308の寸法を持つ83のサンプルがあり、その形状は(83,2308)である。さらに、長さ83のサンプルタイプの配列を持ち、その形状は(83、)です。 私は元のデータセットのサブセットでKNNクラシファイア(2人の隣人)を訓練し、それを使って残りのデータポイントのサンプルタイプ(テストサブセット)を予測しようとしています。私の訓練

    0

    1答えて

    私は、特徴ベクトルにPCAを適用し、その後、私は、次のように、クラスタリングを行う場合は、次の reduced_data = PCA(n_components=2).fit_transform(data) kmeans = KMeans(init='k-means++', n_clusters=n_digits, n_init=10) kmeans.fit(reduced_data) 縮小

    0

    1答えて

    私は今、私はちょうど数値を持つ列を取り、NaN値を落とし、だから私は持ってるためkaggleのタイタニックdataset にPCAを適用したいですよ実際には4つの変数が無視されます(「存続」)。 私はPCA使用して5つのコンポーネントを取った場合、私は、この、データフレームDFにロードされています: pca_model = PCA(n_components=5) pca_model.fit(df

    0

    1答えて

    私は、クランチベースのデータセットでPCAを行って、年間の投資行動を分析しています。私はこれにRを使う。私は2000年から2012年までの間、プロットを作成しました。しかし、私がする必要があるのは、最終的に投資家(ドットで表される)が時間とともにどのように動くかを示すビデオを作成することです。私はk-meansクラスタリングを使用しており、このクラスタを色付けに使用しています。ここで は私の問題で

    0

    1答えて

    で取得しました。私は、線形回帰分析で予測子の数を減らすためにデータフレームで主成分分析を行いました。 pr.out = prcomp(df, scale=TRUE) pr.var = pr.out$sdev^2 pve = pr.var/sum(pr.var) は、私は分散の最も大きな割合を説明する最初のいくつかの主要なコンポーネントと私のデータフレームに古い変数を代用したいと思い、それを

    0

    1答えて

    pca(主成分分析)を行う固有ベクトルを取得しようとしています。パッケージDimensionalityReduction.jlは、pcaeig(X)という非常に必要なコマンドを提供します。ここでXは行列です。 DimensionalityReduction データ= readtable( "中期Data.csv") T =サイズ(データ)[1] Nを使用してデータフレームを を用い は次のように私

    0

    2答えて

    私はデータセットのPCA解析を行っています。変数のPCAの92倍を取得しています。私はちょうど最初の2つのPCA coponentsでそれをプロットしたいと思っていました。 PCA1およびPCA2。 誰もが私にこれを助けることができますか? biplotには2つしか表示されませんか?または私は解釈と少し混乱している。もしそうなら、それは2つのコンポーネントのためだけです。次に、どのようにPCA3と