トレーニング値を入力せずにニューラルネットワークをトレーニングする方法を知りたいと思います。私の前提は、センサからの正/負のフィードバックを受け取ることができるロボットにニューラルネットワークを使用することです。 IEには、物事に衝突することなく自由にローミングするために、衝突センサや近接センサが起動していないときに正のフィードバックが発生します。負帰還は、衝突/近接センサAREがトリガされたときに発生する。この方法を使ってニューラルネットワークをどのように訓練することができますか?ニューラルネットワークトレーニング値なしで学習する
私はこれを書いていますC++
http://en.wikipedia.org/wiki/Temporal_difference_learning多分。私はこのアルゴリズムをチェスに使っています。 – Damir
ありがとうございます、私はこの論文を読む過程にあります:http://remi.coulom.free.fr/Thesis/そして、あなたが今述べたことがこの技術で利用されていることが分かります。 – BumbleShrimp
@Damirあなたはその答えをどうして作りませんか? – BumbleShrimp