softmaxの機能が必要なのはなぜですか？なぜ単純な正規化ではないのですか？

私は深い学習に慣れていないので、これは初心者の質問かもしれません。私の理解では、マルチレイヤパーセプトロンのソフトマックス機能は、各クラスの正規化と確率の分配を担当しています。もしそうなら、私たちは単純な正規化を使わないのはなぜですか？softmaxの機能が必要なのはなぜですか？なぜ単純な正規化ではないのですか？

ベクトルが得られるとします。x = (10 3 2 1) softmaxを適用すると、出力はy = (0.9986 0.0009 0.0003 0.0001)になります。

で各要素を除算すると、の出力はy = (0.625 0.1875 0.125 0.166)になります。

シンプルな正規化のように見える可能性もあります。出力層でsoftmax関数を使用する利点は何ですか？

出典

2017-08-30 soshi shimada