私はニューラルネットワークの機械学習モデルを学習しており、ハイパーパラメータを調整する方法について少し混乱しています。検証データでハイパーパラメータを調整する方法
次のように私はトレーニングプロセスを参照してください。検証データを評価するために、いくつかのハイパーパラメータを持つ
- ビルドニューラルネットワーク(隠れ層のニューロンの例数)
- 更新パラメータトレーニングデータを使用して
- 使用モデルはオーバーフィッティングではなく、性能を評価するために
- 使用テストデータを改善している場合
私は、検証データはハイパーパラメータを調整するためにも使われていると言われてきました。私はの後に検証データを使用してモデルを構築し訓練したので、これを行う方法を理解していません。モデルがすでに構築されているため、ハイパーパラメータを変更することはできません。
私には、ニューラルネットワークのアーキテクチャを指定する4つのハイパーパラメータがあるとします。すべてのハイパーパラメータの組み合わせ(4^4の組み合わせ)について、トレーニング、検証プロセス全体を実行するはずですか?
は
調整のほかに、訓練フェーズで早期に停止するための検証セットを、すべての反復計算で使用することができます。列車の損失だけでなく、検証の損失も計算します。テストの最終的なモデルとして最良の検証損失を生じたパラメータ設定を選択します。 – Ash