-2
非常に一般的な観点から、データセットXを持ち、ラベルYを予測する場合は、PCA(主成分分析)から始めて予測を行う目的(ロジスティック回帰、ランダムな森林など)を直感的かつ理論的な理由から捉えていますか?この場合、予測の質を向上させることができますか? ありがとう!マシン学習の予測 - なぜ、PCAで始まるのか?
非常に一般的な観点から、データセットXを持ち、ラベルYを予測する場合は、PCA(主成分分析)から始めて予測を行う目的(ロジスティック回帰、ランダムな森林など)を直感的かつ理論的な理由から捉えていますか?この場合、予測の質を向上させることができますか? ありがとう!マシン学習の予測 - なぜ、PCAで始まるのか?
PCAベースの次元削減を意味すると思います。低分散データは、常にそうとは限りませんが、予測力はほとんどないため、データセットの低分散ディメンションを削除することは、予測時間を改善する効果的な方法です。信号対雑音比を高める場合には、予測品質を改善することさえ可能である。しかし、これは単なるヒューリスティックなものであり、普遍的な適用はできません。
ここでは話題にはなりません。http://stats.stackexchange.comをご覧ください。 – polku