0
私が見たほとんどの例は、最後の層にsoftmaxを実装しています。しかし、Keras categorical_crossentropy
は、最後のレイヤーの後に自動的にsoftmaxを適用するので、それを行うことは冗長であり、パフォーマンスが低下します。誰が正しい?Keras categorical_crossentropy lossを使用する場合、最後のレイヤでsoftmaxを使用する必要がありますか?
私が見たほとんどの例は、最後の層にsoftmaxを実装しています。しかし、Keras categorical_crossentropy
は、最後のレイヤーの後に自動的にsoftmaxを適用するので、それを行うことは冗長であり、パフォーマンスが低下します。誰が正しい?Keras categorical_crossentropy lossを使用する場合、最後のレイヤでsoftmaxを使用する必要がありますか?
デフォルトでは、Keras categorical_crossentropyは出力にsoftmaxを適用しません(categorical_crossentropy implementationおよびTensorflow backend callを参照)。ただし、バックエンド関数を直接使用する場合は、from_logits=True
を設定するオプションがあります。