私のツリーが十分に深くなって終端ノードが選択され始めているときは、ゼロ移動「プレイアウト」を実行して結果をバックプロパゲーションする必要があると仮定していましたが、IEEE survey of MCTS methodsは選択ステップは "最も緊急の拡張可能なノード"を見つけるべきであり、私は反例を見つけることができません。私は何とかそれらを排除するはずですか?ここで正しいことは何ですか?モンテカルロツリー検索でターミナルノードを処理する方法は?
0
A
答えて
1
選択フェーズで実際に端末ノードに到達した場合は、展開と再生をスキップしても意味がなくなり、その端末ノードの値をまっすぐに伝搬します。
リンクした論文から、これは6ページからは明らかではありませんが、9ページのアルゴリズム2で明らかです。この擬似コードでは、TreePolicy()
関数は終端ノードvを返すことになります。ノードはDefaultPolicy()
関数に渡され、その関数は報酬を直接返します(その関数のwhileループの条件は決して満たされません)。
アルゴリズムを直感的に理解していて、無限の処理時間で最適な値の推定値を保証できるようにしたい場合は、これが望ましいと考えることもできます。無限の処理時間(無限のシミュレーション数)では、「最高の」端末状態からの値を無限にバックアップする必要があるため、ルートに近いノードのバックアップからの平均値も、それらの値に収束します制限内の最良のリーフノード値。
関連する問題
- 1. モンテカルロツリーの検索
- 2. モンテカルロツリー検索交互
- 3. モンテカルロツリー検索の改善点
- 4. モンテカルロツリー検索が機能しない
- 5. セレンIDEの検索でフィールド選択を処理する方法
- 6. Tweepyで結果を検索して処理する方法
- 7. 検索 - テキスト処理
- 8. 検索の結果を処理する方法
- 9. 要求を処理しているKubernetesポッドの検索方法
- 10. PHPでの複数基準の検索の処理方法
- 11. ストアドプロシージャを使用して "キーワード検索"を処理する方法は?
- 12. SharePoint JavaScript CSOM:検索フィールドを処理する最も良い方法は?
- 13. PHPで検索結果ごとに2つのラジオボタンを処理する方法
- 14. 弾性検索構造化クエリでワイルドカードを処理する方法
- 15. 弾性検索アグリゲーター - 欠損値の処理方法
- 16. PostgreSQL用PHPでのブール検索処理
- 17. Railsモデルでビューの検証エラーを処理する方法は?
- 18. モンテカルロツリー検索や確率的なカードゲームのための他のアルゴリズム?
- 19. モンテカルロツリー検索:2人のプレーヤーのゲームのツリーポリシー
- 20. Microsoft Graph CSharp SDK - 検索()はワイルドカード文字を処理するか、ファイルの拡張子を調べるだけで処理する方法はありますか?
- 21. Solace JMSキュー:検索と処理メッセージ
- 22. Mongo cドライバ検索クエリのエラー処理
- 23. 弾性検索履歴データの処理
- 24. のDataTable +サーバーサイド処理+検索フィルタリング
- 25. 弾性検索クエリの検索、_sourceで検索する方法
- 26. PHPでhttpヘッダーを解析/検証/処理する方法
- 27. REST - 単一ページアプリケーションで検証エラーを処理する方法
- 28. algoliaインスタント検索で外部キーで検索する方法は?
- 29. WordPressの検索方法は、製品のみを検索し、カスタム属性を検索する方法ですか?
- 30. Lucene.net検索で特殊文字を使用したワイルドカード検索の処理