最近リリースされたテンソルフロー/モデル/../ object_detectionモデル、特に高速のr-cnnを調べました。4ステップのRPN/Faster R-CNNトレーニングを交互に行う? - Tensorflowオブジェクト検出モデル
紙はあなたが
- 電車RPNだろう4段階の交互訓練を、言及し、その後、電車RCNN
- 、RPN層を凍結し、次いで凍結RCNN層、
- 列車のRPNを、凍結RPN層
- 列車RCNN。私が集めたものから
、2 = RCNN、RPNが実際に凍結されている段階で:
if self._is_training:
proposal_boxes = tf.stop_gradient(proposal_boxes)
のでRCNNの訓練に続いて、RPN +はRPNのレイヤーを凍結訓練はカバーされますが、どこ他はさ3ステップが実行されましたか?
何か不足していますか?
ありがとうジョナサン!他のコードベースと比較して終了しました。実際には4ステップの交互アルゴリズムを実装するものはほとんどありません... 近似的なジョイントトレーニングを使用しているため、グラジエントの通過を停止しますか? 基本的に、これは:「ソリューションは、ネットワーク応答でもあるプロポーザルボックスの座標の導関数を無視します。私たちがnon-approxを実装するならば、RoI Warping Layerとスワップする必要があります。 – macguy
私たちは(crop_and_resizeが完全に微分可能であり、基本的にROIAlign操作と同じでなければならないので、いくつかの論文で見たかもしれない)---私たちはそれが訓練の早い段階で不安定であることを発見したので、それを止める。 –
私は非常に多くの質問があります!私は一緒にそれのいくつかを作ることができた! Fast/Faster/X R-CNNのステージ1では、NMSを使用してRPNの提案を300に制限しています。 Faster R-CNNのステージ2では、300個のプロポーザルボックスを使用し、イメージあたり256個のアンカーをサンプルします。最大128個のアンカーと残りの - 。 この操作は_unpad_proposals_and_sample_box_classifier_batchと同等ですか? – macguy