2

トレーニング値を入力せずにニューラルネットワークをトレーニングする方法を知りたいと思います。私の前提は、センサからの正/負のフィードバックを受け取ることができるロボットにニューラルネットワークを使用することです。 IEには、物事に衝突することなく自由にローミングするために、衝突センサや近接センサが起動していないときに正のフィードバックが発生します。負帰還は、衝突/近接センサAREがトリガされたときに発生する。この方法を使ってニューラルネットワークをどのように訓練することができますか?ニューラルネットワークトレーニング値なしで学習する

私はこれを書いていますC++

+0

http://en.wikipedia.org/wiki/Temporal_difference_learning多分。私はこのアルゴリズムをチェスに使っています。 – Damir

+0

ありがとうございます、私はこの論文を読む過程にあります:http://remi.coulom.free.fr/Thesis/そして、あなたが今述べたことがこの技術で利用されていることが分かります。 – BumbleShrimp

+0

@Damirあなたはその答えをどうして作りませんか? – BumbleShrimp

答えて

5

あなたの説明は、強化学習と呼ばれています。それはニューラルネットワークに適用することができるが、それらを一般に必要としない。被験者を読むための標準的な教科書は、Richard SuttonとAndrew BartoのReinforcement Learning: An Introductionです。ニューラルネットワークと強化学習との関係については、James McClellandによるPDP Handbookに詳しく解説されています。

1

あなたはSLAMを見て撮影したことがありますか?これは、ロボットがエリアをナビゲートする際に同時にそのエリアの地図を構築して保持するための技術です。

+0

確かに私は、このPDFでそれを発見しました:Rossum Project(http://rossum.sourceforge.net/)のhttp://rossum.sourceforge.net/papers/Localization/PosPosterv4.pdfでも、私がその件についてもっと読んでいなかったので、それが何と呼ばれていたかを知らなかったからです。 – BumbleShrimp