1
AlphaGoゼロロス関数は、MCTS確率とNN確率の類似度をどのように測定するのですか?
AlphaGoゼロニューラルネットワークでは、MCTSの確率と値をグラウンドトゥルースラベルとして使用する損失関数を使用しています。私は、ニューラルネットワークの出力がログ(例えば、実数値)または生の確率([0,1])として扱われるかどうかを調べようとしています。損失関数では、MCTS確率([0,1]にあると確信している)のように、NN確率の対数でベクトルを掛けたものになります。これは損失の負の項ですが、この項の大きさは2つのベクトルの類似性について何を示していますか?なぜ値が大きいほど類似性が高いのでしょうか?