1

私はそれは、元の論文の著者によってカフェで実装されて ゼロからresnet 50を実装したいが、私は原因このリポジトリにtensorflow実装 をしたい:https://github.com/KaimingHe/deep-residual-networks この画像その:http://ethereon.github.io/netscope/#/gist/db945b393d40bfa26006 私はすべての等価物(テンソルフロー)を知っていますが、バッチ正規化後のスケールの意味を知ることはできません。バットレンモムで意味を説明し、また "グローバル状態を使う"こともできますか?コンバートresnetの実装はtensorflowする

答えて

0
  1. カフェでアン「インプレース」層は、単にメモリを節約するためにカフェをヒント:代わりに、ネットの入力と出力の両方にメモリを割り当てるの、「インプレース」層は、層の出力と入力を無効にします。
  2. "BatchNorm"でグローバルな状態を使用することは、トレーニング中に計算された平均/標準偏差を使用することを意味し、ではなく、これらの値をそれ以上更新します。これがBN層の「展開」状態です。
+0

返信ありがとうございますが、githubのresnetの実装では、batchnormのパラメータを更新する必要があります。具体的には、Caffeモデルをテンソルフローに変換する実装が必要です。 これは実装されている (https://github.com/chenxi116/TF-resnet) –

+0

@ sh.khに変換されています。 "deploy"/"val" net - トレーニング後にウェイトが固定されている場合、 (とバッチノルムのパラメータ)が絶えず更新されている「列車」のネット。あなたの変換されたネットは、これらの2つのモードで動作できるはずです。 – Shai

+0

@ sh.khはい、トレーニング中にバッチノルムのパラメータを更新する – Shai

関連する問題