主成分分析の文脈におけるバリエーションデータとは何ですか?私は5つの特徴があると仮定するか、または5次元とし、データの変化が何であるかを言うことができますか?意味、すべての機能のデータの変化を指しているのですか?PCAがデータの最大変化の方向にあるのはなぜですか?プリンシパルコンポーネントが最大分散の方向にあるのはなぜですか?
1
A
答えて
1
This回答からCross Validatedは、あなたの質問に対する優れた答えを提供します。
これに加えて、なぜPCAがデータの最大変動方向にあるのですか?、私は情報理論に関するいくつかの基礎を読むことをお勧めします、this blog articleは、主題の素晴らしい紹介を提供します。具体的な例を示すには、5つのフィーチャの中にベクトルが1つあります。それはあなたを助けないという直感的なことです。すべてのサンプルが同じ機能を共有します。この特定の機能の分散はゼロになります。情報はありません。ゼロエントロピーは、もしあなたが望むなら、完璧な順序は、与えられた方向に変化するものは何もないことを意味します:データから落とす明確な候補。分散を増やす=情報の内容を増やす。
関連する問題
- 1. ストアドプロシージャ名に最大長があるのはなぜですか?
- 2. 分散型ゲームツリートラバーサルに最適なファイルシステムはありますか?
- 3. structに余分なフィールドを追加すると、パフォーマンスが大幅に向上するのはなぜですか?
- 4. グループから最大の分散を削除する
- 5. プリンシパルコンポーネント分析を使用して最適なラインを見つけるには?
- 6. PCAの分散が最も大きいコンポーネントの選択
- 7. 式のstatic_castが分散して動作するのはなぜですか?
- 8. 行方向の最大
- 9. GridViewに余分な行があるのはなぜですか?
- 10. イメージに余分なスペースがあるのはなぜですか?
- 11. SSISランタイムが分散トランザクションを開始できないのはなぜですか?
- 12. 最大分散が展開されている
- 13. 大規模なデータセット用の分散レプリケートバイナリストレージ
- 14. 最大ヒープサイズを大きくすると、スレッドの最大数が減少するのはなぜですか?
- 15. Erlangでは、分散システムをアップグレードする最善の方法は何ですか?
- 16. 分散アーキテクチャでは、なぜバージョン管理が難しいのですか?
- 17. Redisson分散ロックの最大許可数を設定する方法
- 18. Oracle分散データベースでLOBを処理する最適な方法
- 19. 分散が最も大きい上位20個のグループを特定する
- 20. 大きなウィンドウにレンダリングされない部分があるのはなぜですか?
- 21. 分散システム、最高のフレームワーク?
- 22. Rails - 大きなテーブルと分散テーブル
- 23. SciPyは、分散が0のサンプルでt検定のために `nan`を返すのはなぜですか?
- 24. 分散がある限られた数のポイントに対する最適なパラメータ最適化アルゴリズム
- 25. Redis Cluster vs Pub/SubのZeroMQと水平方向の分散システム
- 26. なぜ分類問題でAUCを最大化したいのですか?
- 27. ipadフレームの最大サイズが十分ではありません
- 28. ウェブサイトの右下に余分なスペースがあるのはなぜですか?
- 29. なぜpysparkは分散の値が間違っていますか?
- 30. パラメータの前に自分のパスにドットがあるのはなぜですか?