私は補強学習の初心者です。この危険な地形を簡単にナビゲートするためのフレームワーク/モジュールを探しています。私の検索では、2つのモジュールkeras-rl & OpenAI GYMを見てきました。keras-rl/OpenAI GYMでカスタム環境を実装するには?
WIKIで共有している例では、両方とも2つの作業を行うことができますが、あらかじめ定義された環境があり、独自のカスタム環境の設定方法に関する情報はほとんどまたはまったくありません。
誰かがチュートリアルに向けて私を指摘したり、ゲーム以外の環境をセットアップする方法について私に説明することができたら、本当に感謝しますか?
_seedメソッドは必須ではありません。実装されていない場合、カスタム環境はgym.Envから_seedを継承します。同様に_renderも実装するのはオプションのようですが、1つ(または少なくとも少なくとも1つ)のクラス変数である 'metadata'を含める必要があるように見えますが、これは辞書の一つのキー' render.modes'がリスト許容レンダリングモードのうちの1つである。 _renderを実装していない場合、正しい値は[human]と思われます – user1245262