私はMountain Car Task
を解決するためにサットンの本で説明されたqを推定するエピソードセミグラジエントサルサを実装しようとしています。おおよそq
私はneural network
を使いたいと思っています。したがって、私はthisコードを思いついた。しかし、残念なことに私の代理人は実際にその課題を解決することを学んでいません。いくつかのエピソードでは、ソリューションは非常に高速(100〜200ステップ)であることがわかりますが、エージェントが30kステップ以上を必要とすることもあります。私は私の実装でいくつかの基本的な間違いを犯したと思いますが、私はそれを自分で見つけることができません。誰かが私を助け、私の実装でエラー/間違いを指摘できますか?サルサはニューラルネットワークを使ってマウンテンカータスクを解決します
2
A
答えて
1
:代わりのそれのQ-value
を予測する(state, action)
ペアを使用して、私は道DQN
でそれを変更しそれをしない:私は3つのすべての可能なアクションのvalue
予測この予測に従って行動を選択します。以前のアプローチでは問題を見つけることができませんでしたが、少なくともこれは現在機能しています。
関連する問題
- 1. XORマッピングを解決するニューラルネットワークを訓練できません
- 2. スタティックファイルはDjangoチャンネルを使って問題を解決しています
- 3. ニューラルネットワークOCR - 確率を使って接触記号を決定するか?
- 4. opencv pythonを使ってtheta mazesを解決するには?
- 5. ジェネリッククラスを使って迷路を解決するには?
- 6. hadoopを使って以下のusecaseを解決するには?
- 7. WEKAはクラス値を使用して決定木を解決しますか?
- 8. DFSまたはGreedy BFSを使用して解決策を解決しましたか?
- 9. DFSを使った迷路解決
- 10. このプールゲームをどうやって解決しますか?
- 11. MATLAB:dsolveを使って正確な解を決定する
- 12. adjacenyマトリックスを使ってグラフの問題を解決する
- 13. A *を使ってトラベリングセールスマンを解決する
- 14. Amazon Route 53はmydomain.comを解決しますが、www.mydomain.comは解決しません
- 15. フィルタでNinjectを使って解決するMVC2
- 16. Swinject:メタタイプのリストを使って解決する
- 17. mysql - グループを使用して問題を解決しました。
- 18. AntiCaptchaを使ってFunCaptcha/RotateCaptchaをどのように解決できますか?
- 19. CodeIgniterを使用して404エラーを解決するには?
- 20. PRISM:MVVMを使用して、コンストラクタオブジェクトを解決または注入する方法は?
- 21. ニューラルネットワークを使ってアドバイスを提供する
- 22. Autoencoderのウェイトを使ってテンソルフローのニューラルネットワークを初期化する
- 23. Webpackを模倣してJestを設定してルートを解決し、エイリアスを解決します
- 24. AWS AMI Linuxは引数を使用してcrontabを設定します。私は多くの解決策を試しましたが解決できません
- 25. ニューラルネットワークを使った天気予報
- 26. ジュリアのMXNetを使ったニューラルネットワークの例
- 27. 転送学習を使用して、データの異なるサブセットでニューラルネットワークを再学習してメモリの問題を解決できますか?
- 28. ローカルのHOSTSファイルは解決しますが、IPは解決しません。
- 29. OpenCVを使用してニューラルネットワークを作成しますか?
- 30. カスタムビューを使用してsetImageBitmapメソッドを解決できません