monte-carlo-tree-search

    0

    1答えて

    誰でも明確な方法を教えてください(私はどこにも明確な例が見つからないため)MCTSアルゴリズムは2番目のプレーヤーを繰り返します。 私はちょうどそれが例えばP1の移動ごとに再生されているように見えると思われるすべて。 私は1つのエージェントの手順を理解していますが、P2をどこに配置するのかわからないことはありません。 は基本的に私が期待する:各ITER用 : 選択ノードPlayer1が Playe

    2

    1答えて

    私はゲームにMCTSアルゴリズムを実装しようとしています。私は移動あたり約0.33秒しか使用できません。この時点では、約500の子ノードを含む開始状態から、1つの子供につき1つまたは2つのゲームを生成することができます。私のシミュレーションはランダムではありませんが、もちろん、1つまたは2つのシミュレーションに基づいて正しい選択をすることはできません。さらにゲームではツリーが小さくなり、私の選択は