Actor Mimicは、アクションマスキング手順の実装について話しています。私は誰もがアイデアを持っています特定のゲームを遊んでいる間、私たちはそのゲームのためには有効ではありませんAMNアクション出力をマスクし、有効なアクションアクションマスキングはどのように実装されますか?
のサブセットのみを介してソフトマックスを取る
を引用しますこのアクションマスキングをTensorflowでどのように実装できるかについて具体的には、特定のアクションのサブセットに対してのみsoftmaxをどのように取るのでしょうか?