5
私はKerasでバッチ正規化を行ってきました。私は、バッチ正規化がニューラルネットワークへの入力を正規化するかどうか疑問に思っていました。それは私のネットワークへの入力を標準化し、BNに依存する必要がないということですか?バッチ正規化を使用している場合、入力を標準化する必要がありますか?
私はKerasでバッチ正規化を行ってきました。私は、バッチ正規化がニューラルネットワークへの入力を正規化するかどうか疑問に思っていました。それは私のネットワークへの入力を標準化し、BNに依存する必要がないということですか?バッチ正規化を使用している場合、入力を標準化する必要がありますか?
確かにそれを使用することはできますが、それを行うようには設計されておらず、限られたサンプルサイズ(サンプルサイズはバッチサイズです)のため、正規化でサンプリングエラーが発生する可能性が高くなります。
バッチ正規化を使用することを推奨しない理由のもう一つの要因は、訓練データを無効にしなければ歪ませる補正項ガンマとベータ(訓練されたパラメータ)を導入することです。
テストデータを正規化するには、完全なトレーニングセットまたはバッチ正規化ではなく適切なものについてz-score正規化を使用することをお勧めします。
したがって、最初の層としてBatchNormalization(運動量= 1とε= 0を除く)のすべての標準パラメータを使用すると、zスコアの正規化と本質的に等しいと言いますか? –
平均値と分散(つまり、バッチサイズ)を見積もるには、小さいサンプルを使用します。 – nemo