2017-11-06 2 views
1

imgAlphaGoゼロロス関数は、MCTS確率とNN確率の類似度をどのように測定するのですか?

AlphaGoゼロニューラルネットワークでは、MCTSの確率と値をグラウンドトゥルースラベルとして使用する損失関数を使用しています。私は、ニューラルネットワークの出力がログ(例えば、実数値)または生の確率([0,1])として扱われるかどうかを調べようとしています。損失関数では、MCTS確率([0,1]にあると確信している)のように、NN確率の対数でベクトルを掛けたものになります。これは損失の負の項ですが、この項の大きさは2つのベクトルの類似性について何を示していますか?なぜ値が大きいほど類似性が高いのでしょうか?

答えて

1

hereで説明したように、クロスエントロピー損失のモンテカルロ推定であることが判明しました。

関連する問題