私は、tic-tac-toeを再生できるニューラルネットワークを作成します。ネットワークには9つの入力ニューロンがあり、ボードの状態(ネットワーク移動の場合は1、相手の移動の場合は1.5、空のセルの場合は0)と出力ニューロンが9つあります(出力ニューロンの値が最高値の場合は、状態)。ネットワークには隠れ層がありません。活性化機能 - シグモイド。学習方法 - Q学習+バックプロパゲーション。tic-tac-toeのニューラルネットワーク
ネットワークは訓練されていますが、不十分です(占有されているセルのステップを続けます)。だから私は隠された層を追加することにしました。そして、私は質問したいと思います:
隠れ層の中で使用するニューロンの数と、どのような活性化関数が隠れ層と出力層に適していますか?
私はあなたのプロジェクトが好きです。あなたがGithubに投稿すると、皆に利益をもたらすでしょう。残念ながら、私たちがこの質問にどのように答えているかははっきりしていません。あなたの質問は、機械学習の質問よりも、あなたが私にバグを持っているように聞こえます(占領されたセルに歩み寄る)。 – SmallChess