私は深い学習に慣れていないので、これは初心者の質問かもしれません。 私の理解では、マルチレイヤパーセプトロンのソフトマックス機能は、各クラスの正規化と確率の分配を担当しています。 もしそうなら、私たちは単純な正規化を使わないのはなぜですか?softmaxの機能が必要なのはなぜですか?なぜ単純な正規化ではないのですか?
ベクトルが得られるとします。x = (10 3 2 1)
softmaxを適用すると、出力はy = (0.9986 0.0009 0.0003 0.0001)
になります。
で各要素を除算すると、 の出力はy = (0.625 0.1875 0.125 0.166)
になります。
シンプルな正規化のように見える可能性もあります。 出力層でsoftmax関数を使用する利点は何ですか?