統計では、フィーチャの正規化はほとんど行いません。必要に応じて共変量を中心にしますが、正規化は行いません。機械学習では、詳細な学習機能の正規化が最も重要です。一部のアプリケーションで重要な理由は何ですか、他のアプリケーションでは重要ではありません。フィーチャの正規化
1
A
答えて
2
機械学習アプローチでは、スケーリングは目的関数の計算に影響するため重要です。
たとえば、多くのアルゴリズムでユークリッド距離を使用して分類を行いますが、他のフィーチャよりもはるかに大きな値を持つフィーチャがあれば、そのフィーチャは距離を支配するため、この単独フィーチャの影響を受けるだけです。
スケーリングはまた、グラジェント降下(エラー関数を最小限に抑えるために多くのアルゴリズムで使用される方法)をより迅速に収束させるのに役立ちます。 SVMも正規化された値でより早くトレーニングします。
要約すると、同じスケールですべての値を持つことは、計算に役立ちます。私が推測するところによると、なぜ機械学習において重要で統計的にはそれほど重要でないのかということは、機械学習アルゴリズムは通常、何度も反復するループを持つということです。各反復において、「スケール外」の値はますます影響を受け、モデルを支配します。一方、統計的方法はこれらのループを持たないので、スケーリングはそれほど影響を与えません。
関連する問題
- 1. データ/フィーチャの正規化
- 2. SVMのフィーチャ値を正規化
- 3. scikit-learnのロジスティック回帰フィーチャ値の正規化
- 4. パンダ正規化
- 5. データベーステーブルの正規化
- 6. SQLの正規化
- 7. テーブルの正規化
- 8. データベースの正規化
- 9. テーブルの正規化
- 10. Cassandraの正規化
- 11. データの正規化
- 12. SQLの正規化
- 13. リレーショナルデータベースの正規化
- 14. Kolmogorov-Smirnov MATLABの正規化テスト - データの正規化?
- 15. 入力正規化の代わりにバッチ正規化
- 16. 類似データの正規化データベースと非正規化データベース
- 17. 2NFデータベース正規化
- 18. 非正規化値
- 19. バッチ正規化 - Tensorflow
- 20. matlab正規化コードアルゴリズム
- 21. 正規化はsklearn
- 22. 非正規化IEEE
- 23. URLを正規化/正規化と一致させる
- 24. URLを正規化/正規化しますか?
- 25. スキューされたフィーチャの最も適切な正規化/変換方法ですか?
- 26. スカラーのMinMax正規化
- 27. JSのテキスト正規化
- 28. ASCII文字の正規化
- 29. データウェアハウス - スノーフレークスキーマの正規化
- 30. ユーザ名の正規化