私は現在、Principal Component Analysis(PCA)を使用するプロジェクトに取り組んでいます。幸運なことに、Pythonにはscikitlearn.decompositionの非常に便利なモジュールがあります。これはほとんどの作業を行うようです。私が本当にそれを使用し始める前に、私はそれが何をしているのかを正確に把握しようとしています。Pythonでscikitlearn PCA.transform関数を理解する
私はこのようなルックスでテストされてきたデータフレーム:私はPCA.fitを(呼び出し)してからコンポーネントを表示するとき
0 1
0 1 2
1 3 1
2 4 6
3 5 3
は、そして私が手:私はむしろから
array([[ 0.5172843 , 0.85581362],
[ 0.85581362, -0.5172843 ]])
PCAの限られた知識、私はこれがどのように計算されたのか把握していますが、私が紛失するのはPCA.transformを呼び出すときです。これは、私に与え出力されます。
array([[-2.0197033 , -1.40829634],
[-1.84094831, 0.8206152 ],
[ 2.95540408, -0.9099927 ],
[ 0.90524753, 1.49767383]])
誰かが潜在的にそれが本来のデータフレームや部品を取り、この新しい配列に変換する方法を通じて、私を歩いてもらえますか?正確な計算を理解できるようにしたいので、スケールアップするときに何が起こっているのかが分かりやすくなります。ありがとう!
これは実際に何が起こっているのかを理解する上で大きな助けとなります。私は間違いなくウィキペディアをチェックして、PCAについて何が言いたいのかを見ていきます。ありがとう! – JSolomonCulp