2016-10-19 10 views
-2

非常に一般的な観点から、データセットXを持ち、ラベルYを予測する場合は、PCA(主成分分析)から始めて予測を行う目的(ロジスティック回帰、ランダムな森林など)を直感的かつ理論的な理由から捉えていますか?この場合、予測の質を向上させることができますか? ありがとう!マシン学習の予測 - なぜ、PCAで始まるのか?

+1

ここでは話題にはなりません。http://stats.stackexchange.comをご覧ください。 – polku

答えて

0

PCAベースの次元削減を意味すると思います。低分散データは、常にそうとは限りませんが、予測力はほとんどないため、データセットの低分散ディメンションを削除することは、予測時間を改善する効果的な方法です。信号対雑音比を高める場合には、予測品質を改善することさえ可能である。しかし、これは単なるヒューリスティックなものであり、普遍的な適用はできません。

関連する問題