monte-carlo-tree-search

0熱

1答えて

誰でも明確な方法を教えてください（私はどこにも明確な例が見つからないため）MCTSアルゴリズムは2番目のプレーヤーを繰り返します。私はちょうどそれが例えばP1の移動ごとに再生されているように見えると思われるすべて。私は1つのエージェントの手順を理解していますが、P2をどこに配置するのかわからないことはありません。は基本的に私が期待する：各ITER用：選択ノードPlayer1が Playe

2熱

1答えて

モンテカルロツリー検索の改善点

私はゲームにMCTSアルゴリズムを実装しようとしています。私は移動あたり約0.33秒しか使用できません。この時点では、約500の子ノードを含む開始状態から、1つの子供につき1つまたは2つのゲームを生成することができます。私のシミュレーションはランダムではありませんが、もちろん、1つまたは2つのシミュレーションに基づいて正しい選択をすることはできません。さらにゲームではツリーが小さくなり、私の選択は