2017-08-20 22 views
1

訓練を受けたAIエージェントを使用して簡単なゲームをプレイできるWebサイトを作成する予定です。訓練された強化学習モデルをWebサービスに配備する方法は? テンソルフローを使用できますか? Andrej Karapathyのconvnet.jsフレームワークはこのために便利ですか?Webサービスに訓練された強化学習モデルを導入する方法

+0

多分お試しください! https://pair-code.github.io/deeplearnjs/ ウェブ上でのGPUアクセラレーションコンピューティングとテンソルフローに基づくAPI – Andnp

答えて

0

私はconvnet.jsを試して、同じように他のjavascriptライブラリを試しましたが、それは役に立たないです。あなたは、ニューラルネットワークで起こっていることを決して知ることができません。 1日中エージェントを訓練した後でさえ、それは重要な出力を出さなかった。

私の提案は、WebサービスとしてPythonプログラムを作成することです。その場合はflaskを使用できます。アクションを起こす必要があるときにゲームからWebサービスに電話をかける。サービスはアクションのみを返します。この方法では、何が実行されているかを知ることができます。グラフをプロットして、変更を非常に簡単に通知することができます。ここ

は、Webサービスのための私のコードスニペットで

from flask import Flask 
from flask import request 
from flask_cors import CORS 

app = Flask(__name__) 
CORS(app) 


@app.route("/update", methods=['POST']) 
def rest_update(): 
    reward = request.form.get('reward') 
    reward = float(reward) 
    state = request.form.get('state') 
    state = state.split(',') 
    new_state = [] 
    for each in state: 
     new_state.append(float(each)) 

return str(brain.update(reward,new_state)) 

if __name__ == '__main__': 
    app.run(debug=True) 

更新は、入力とリターンアクションとして報酬と状態を取る関数です。状態はコンマ(、)で区切られた文字列として入力されます。 この方法は私のプロジェクトに最適です。

編集:あなたが快適なPython用の任意のライブラリを使用することができます。それは、ピンクまたはテンソルフローまたは他のものであり得る。

関連する問題