私は、強化学習設定でいくつかのタスクを実行するのに必要なマウスの動きを学習するエージェントを取得しようとしています。学習)。継続的な*アクション*スペースで動作するようにQ-ラーニングを一般化する
私はQ-ラーニングテクニックを使用したいと考えていますが、a way to extend this method to continuous state spacesが見つかりましたが、連続したアクションスペースで問題を解決する方法を理解できないようです。
私はすべてのマウスの動きを特定の大きさと特定の数の異なる方向に強制することができますが、アクションを離散化する合理的な方法であれば、巨大なアクションスペースが得られます。標準のQ-learningはエージェントがすべてのアクションを評価する必要があるため、このような近似は実用的な意味では問題を解決しません。
ああ、これらのサウンドスポットライトです。私がそれらを試して、彼らが期待するように彼らが働くならあなたの答えを受け入れるでしょう。 – zergylord