2
log_probがスカラーではなくベクトルであるとします。次のコードは何をしますか? ありがとうございました!損失がベクトルの場合のtf.trian.optimizerの動作
`
optimizer = tf.train.AdamOptimizer(0.001)
minimize = optimizer.minimize(log_prob)
session.run(minimize, feed_dict={action : act, feat : s_batch})
`
ヤコビ行列を計算するのではなく、スカラーを得るためにlog_probを合計するだけです。ここの議論を参照してください:https://github.com/tensorflow/tensorflow/issues/675 –
@AllenLavoie - あなたはあなたがそれを釘付けにしたのであなたのコメントを答えに変えることができますか?ありがとう! – dga