3
私はカフェLeNetチュートリアルhereをチェックしていたし、疑問が頭に浮かんだ。これらの違いは何カフェLeNet:solver.step `の違い(1)`と `solver.net.forward()`
2つのコード:
self.solver.step(1)
と
self.solver.net.forward() # train net
彼らは両方とも、少なくともコメントに応じてネットワークを訓練するように見えます。
個人的に私は最初のものは学習データにネットワークを訓練し、net
とtest_net
両方の重みを更新しますが、二つだけのデータのバッチを転送し、前のステップから学んだの重みを適用しているようだと思います。
私は正しいと思うなら、チュートリアルの2番目のコードの目的は何ですか?なぜコードはnet.forward
ですか? solver.step(1)
これを行うことはできませんか?お時間を
おかげ
thanks ... batch_sizeが100(2000イメージのうち)の場合、100バッチまたは2000バッチで3つのフェーズを実行しますか? – Cypher
ステップでは1回の反復しか行われません。 20個のバッチ(2000個全ての入力)のフルセットを* epoch *と呼びます。 – Prune
助けになるのはうれしいです。投票と緑色のチェックをいただきありがとうございます。 – Prune