ボードゲームのパラメータの最適化AI

オセロをプレイできる小さなAIプログラムを作成しました。私が使用しているアルゴリズム（MCTS UTC）には、探査と搾取の比率を調整できるパラメータがあります。これは0から10の範囲の単一の浮動小数点値です（無限大でも大きな値は意味をなさない）ボードゲームのパラメータの最適化AI

このパラメータの値が異なると、アルゴリズム自体を簡単に再生させることができます。これは私に2つの値のどちらが良いかという考えを与えるでしょう。

このパラメータを最適化するには、どのようなアルゴリズムが適していますか？

（私はなぜか、ときに最適に動作するように徹底的に行くためにいくつかの研究や出版物を持っているアルゴリズムを好む。）

2017-02-07 Xeli

プログラムは、自身と受賞者を演じている遺伝的アルゴリズムのために何かを考えてみましょう比率は維持され、少し変化する。値を追跡します。時間の経過とともに、それは「最良の」バランスに収束することがあります。

2017-02-07 16:46:04 EvilTeach

答えて