2017-07-27 10 views
1

Link to paperRPNをより速いR-CNNでトレーニングする方法は?

私は高速なrcnnで地域提案ネットワークを理解しようとしています。私はそれが何をしているのか理解していますが、トレーニングの仕組み、特に詳細はまだ分かりません。

VGG16の最後のレイヤーを14x14x512(maxpoolの前と228x228の画像の前)、k = 9の異なるアンカーで使用しているとしましょう。推論の時に私は9 * 2のクラスラベルと9 * 4バウンディングボックスの座標を予測したいと思います。私の中間層は512次元のベクトルです。彼らは、我々はランダムにサンプリングされたミニバッチの損失 関数を計算するために画像256のアンカーを、サンプル」

を書き込む紙で (画像ZFネットワークから256を示している) from the paper

正と負の のアンカーの比率は1:1までです。

これはわかりません。 これは、9(k)アンカータイプのそれぞれについて、そのタイプの正と負のアンカーしか含まないミニバッチで特定の分類子と回帰子が訓練されていることを意味しますか?

私は基本的に中間レイヤーで共有ウェイトを持つk個の異なるネットワークを訓練していますか?したがって、各ミニバッチは、訓練データx = conv特徴マップの3x3x512スライディングウィンドウと、y =その特定のアンカータイプのグランド真理とからなる。 そして推論の時に私はそれらをすべてまとめました。

ご協力いただきありがとうございます。

答えて

0

正確ではありません。私が理解していることから、RPNは、特徴マップごとにWHKバウンディングボックスを予測し、1:1基準ごとに256個のサンプルをランダムにサンプリングし、特定のミニバッチの損失関数の計算の一部として使用します。 256種類のランダムサンプルは特定のタイプではないので、あなたはまだkではなく1つのネットワークしかトレーニングしていません。

免責事項:私は一ヶ月前にCNNsについて学習し始めたので、理解できるとは思えません。

関連する問題