答えて

8

通常、このような場合、損失は単純に分類損失と回帰損失の加重和とみなされます。言い換えれば、あなたのネットワークは2つの独立した出力部分を持っています.1つは回帰喪失L_reg(MSEなど)を適用し、もう1つは分類部分を担当し、分類損失L_class(クロスエントロピーなど)を適用します。あらかじめ定義されたアルファの場合、最終的な最適化基準は単に(alpha)* L_reg +(1-alpha)* L_classです。これにより、グラジエント(および全体的な簡単な解析)の計算が容易になります。

+0

よろしくお願い致します。アルファは通常、ハイパーパラメータとして扱われ、そのように調整されていますか? – jayesian

+0

はい、妥当な値を見つけるために何らかの問題の特性を利用できない限り – lejlot

関連する問題