言語モデルの混乱は、どのようにして0と1の間にありますか？

Tensorflowでは、私は0.602129または0.663941のような出力を得ています。 0に近い値はより良いモデルを意味するように見えますが、perplexityは2^lossと計算されているように見えます。これは損失が負であることを意味します。これは意味をなさない。言語モデルの混乱は、どのようにして0と1の間にありますか？

出典

2017-07-02 Evan Weissburg