Tensorflow's object detection APIを使用してRCNN検出ネットワークを構築しています。Tensorflowオブジェクト検出APIに否定的な例を含めるべきですか?
私の目標は、屋外ビデオで動物の境界ボックスを検出することです。ほとんどのフレームは動物を持たず、動的な背景に過ぎません。
ほとんどのチュートリアルでは、カスタムラベルのトレーニングに重点を置いていますが、ネガティブトレーニングサンプルについては言及していません。これらのクラスの検出器は、対象となる対象物を含まない画像をどのように扱うのですか?それはちょうど低い確率を出すか、画像内にバウンディングボックスを描こうとしますか?
私の現在の計画は、潜在的なフレームを生成し、訓練されたネットワークにそれらを渡すためにopencvで伝統的なバックグラウンド減算を使用することです。また、「バックグラウンド」の枠組みのクラスを「ネガティブデータ」として含めるべきですか?
最後のオプションは、バックグラウンドの減算にはopencv、境界ボックスの生成にはRCNN、動物とバックグラウンドを識別する作物の分類モデルです。
対象オブジェクトなしのイメージに直面したときに、単一のクラス検出器が期待する動作は何ですか?低い確率のスコア?フレーム全体をカバーする境界ボックス? – bw4sz
その場合の希望はボックスが返されないということです:) –