開始時の損失/ clone_0/softmax_cross_entropy_lossと損失/ clone_0/aux_loss/valueの違いは何ですか? 現在、私は4つのGPU(num_clones = 4)でtf-slimとinception-v4ネットワークを使用して大規模なモデルを訓練しています。これらの2つのチャートは全く異なっています。バッチサイズ= 128の190Kステップ後に、これらのチャートが得られます。Losses損失/ clone_0/softmax_cross_entropy_lossと損失/ clone_0/aux_loss /値の差
画像に見られるように全損失と同様の傾向があります。 softmax_cross_entropyは完全に異なる手続きを持っています! これらの損失のうち、トレーニング手順をよりよく説明できるのはどれですか?