私はこの決定がタスクに依存することを理解しますが、私に説明させてください。tanhのような活性化機能と最後の層で線形活性化機能を使用することに利点はありますか?
私は、端に高密度レイヤーを持つ畳み込みニューラルネットワークを使用して、特定のダッシュボードビデオフレームからステアリングアングルを予測するモデルを設計しています。最終的な高密度層では、ステアリング角度を予測するユニットは1つしかありません。
私の仕事のために、以下のいずれかのオプションを選択するとパフォーマンスが向上しますか?
a。グラウンド・トゥルース・ステアリング・アングルを取得し、ラジアンに変換し、tanhを使用してそれらをスカッシュして、-1と1の間にします。ネットワークの最終密集層では、tanhアクティブ化関数を使用します。
b。地面の真理のステアリング角度を取得します。これらの生の角度は-420から420度です。最後のレイヤーでは、線形アクティブ化を使用します。
私は論理的に考えています。オプションAでは、ネットワークがはるかに小さい数字を扱っているので、損失はもっと小さくなる可能性があります。これにより、重量の変化が小さくなります。
あなたの考えを教えてください!