Link to paperRPNをより速いR-CNNでトレーニングする方法は?
私は高速なrcnnで地域提案ネットワークを理解しようとしています。私はそれが何をしているのか理解していますが、トレーニングの仕組み、特に詳細はまだ分かりません。
VGG16の最後のレイヤーを14x14x512(maxpoolの前と228x228の画像の前)、k = 9の異なるアンカーで使用しているとしましょう。推論の時に私は9 * 2のクラスラベルと9 * 4バウンディングボックスの座標を予測したいと思います。私の中間層は512次元のベクトルです。彼らは、我々はランダムにサンプリングされたミニバッチの損失 関数を計算するために画像256のアンカーを、サンプル」
を書き込む紙で (画像ZFネットワークから256を示している)
正と負の のアンカーの比率は1:1までです。
これはわかりません。 これは、9(k)アンカータイプのそれぞれについて、そのタイプの正と負のアンカーしか含まないミニバッチで特定の分類子と回帰子が訓練されていることを意味しますか?
私は基本的に中間レイヤーで共有ウェイトを持つk個の異なるネットワークを訓練していますか?したがって、各ミニバッチは、訓練データx = conv特徴マップの3x3x512スライディングウィンドウと、y =その特定のアンカータイプのグランド真理とからなる。 そして推論の時に私はそれらをすべてまとめました。
ご協力いただきありがとうございます。