私はRLにSuttonの本で紹介されました。この知識をさらに高めるために、エージェントが生のピクセルからどのように学習し、H2Oを使用した例を実装しようとしているかを調べたいと思います。私はJava APIを使いたいです。強化学習 - 生のピクセルから学ぶ
- スパークリングウォーターは私が使用すべき分布ですか?
- 生のピクセルをh2oにストリームするにはどうすればよいですか?たとえば、ピンポンゲームを使ってh2o RLエージェントを学習させるにはどうすればよいですか?どのようなディープラーニングのh2o APIが使われていますか?
私がRLについて学ぶために他の文献を参照しているので、回答がh2oに関するものであれば分かります。
更新:http://h2o2016.wpengine.com/wp-content/themes/h2o2016/images/resources/DeepLearningBooklet.pdf
しかし、それでもまだ、私はH2OのRLエージェントが学ぶのを助けるためにゲームから画像ピクセルをストリーミングするためにJavaを使用する方法を理解する必要があります。例は主にRとPythonを使用しています。
しかし、このコードではすでにh2oにある基本的なアルゴリズムが必要です。 1つは少数を結合し、結果を得ることができるか。 –
@MohanRadhakrishnanはい、そうです、H2Oは、強化学習フレームワークを含むように拡張することができます。私が気づいている瞬間、誰もそれを積極的に取り組んでいません。 –