0

入力は可変サイズの配列です。 train_modelでは、一度に1つのサンプルしか処理できません。私はバッチの要素の目的の合計を累積し、正則化と勾配降下を適用したいと思います。theano - 多くの同じ機能を持つ方法

現在、これは各要素xiの更新が行われるトレーニング段階です。

バッチ内の要素の数に対してtrain_model(xi)の結果を取得して更新を行うにはどうすればよいですか?

答えて

0

dataset.get_next_xi(batch_size)のすべての要素を入力として使用し、平均コスト(1つのコストのみではなく)を計算し平均コストを使用して更新を行うtheano関数を作成します。あなたは、彼らがこのように列車のモデルからtheano機能を使用here

からのコード例を見ることができます:cost

train_model = theano.function(
    inputs=[index], 
    outputs=cost, 
    updates=updates, 
    givens={ 
     x: train_set_x[index * batch_size: (index + 1) * batch_size], 
     y: train_set_y[index * batch_size: (index + 1) * batch_size] 
    } 
) 

は、データセットのバッチの平均コストである

関連する問題