0
オセロをプレイできる小さなAIプログラムを作成しました。私が使用しているアルゴリズム(MCTS UTC)には、探査と搾取の比率を調整できるパラメータがあります。これは0から10の範囲の単一の浮動小数点値です(無限大でも大きな値は意味をなさない)ボードゲームのパラメータの最適化AI
このパラメータの値が異なると、アルゴリズム自体を簡単に再生させることができます。これは私に2つの値のどちらが良いかという考えを与えるでしょう。
このパラメータを最適化するには、どのようなアルゴリズムが適していますか?
(私はなぜか、ときに最適に動作するように徹底的に行くためにいくつかの研究や出版物を持っているアルゴリズムを好む。)