ニューラルネットワークトレーニング値なしで学習する

トレーニング値を入力せずにニューラルネットワークをトレーニングする方法を知りたいと思います。私の前提は、センサからの正/負のフィードバックを受け取ることができるロボットにニューラルネットワークを使用することです。 IEには、物事に衝突することなく自由にローミングするために、衝突センサや近接センサが起動していないときに正のフィードバックが発生します。負帰還は、衝突/近接センサAREがトリガされたときに発生する。この方法を使ってニューラルネットワークをどのように訓練することができますか？ニューラルネットワークトレーニング値なしで学習する

私はこれを書いていますC++

出典

2012-01-25 BumbleShrimp

http://en.wikipedia.org/wiki/Temporal_difference_learning多分。私はこのアルゴリズムをチェスに使っています。 – Damir

ありがとうございます、私はこの論文を読む過程にあります：http://remi.coulom.free.fr/Thesis/そして、あなたが今述べたことがこの技術で利用されていることが分かります。 – BumbleShrimp

@Damirあなたはその答えをどうして作りませんか？ – BumbleShrimp

あなたの説明は、強化学習と呼ばれています。それはニューラルネットワークに適用することができるが、それらを一般に必要としない。被験者を読むための標準的な教科書は、Richard SuttonとAndrew BartoのReinforcement Learning: An Introductionです。ニューラルネットワークと強化学習との関係については、James McClellandによるPDP Handbookに詳しく解説されています。

出典

2012-01-26 00:01:17

あなたはSLAMを見て撮影したことがありますか？これは、ロボットがエリアをナビゲートする際に同時にそのエリアの地図を構築して保持するための技術です。

出典

2012-01-25 21:45:44 phs

確かに私は、このPDFでそれを発見しました：Rossum Project（http://rossum.sourceforge.net/）のhttp://rossum.sourceforge.net/papers/Localization/PosPosterv4.pdfでも、私がその件についてもっと読んでいなかったので、それが何と呼ばれていたかを知らなかったからです。 – BumbleShrimp

ニューラルネットワークトレーニング値なしで学習する

答えて

関連する問題