1

Tensorflow's object detection APIを使用してRCNN検出ネットワークを構築しています。Tensorflowオブジェクト検出APIに否定的な例を含めるべきですか?

私の目標は、屋外ビデオで動物の境界ボックスを検出することです。ほとんどのフレームは動物を持たず、動的な背景に過ぎません。

ほとんどのチュートリアルでは、カスタムラベルのトレーニングに重点を置いていますが、ネガティブトレーニングサンプルについては言及していません。これらのクラスの検出器は、対象となる対象物を含まない画像をどのように扱うのですか?それはちょうど低い確率を出すか、画像内にバウンディングボックスを描こうとしますか?

私の現在の計画は、潜在的なフレームを生成し、訓練されたネットワークにそれらを渡すためにopencvで伝統的なバックグラウンド減算を使用することです。また、「バックグラウンド」の枠組みのクラスを「ネガティブデータ」として含めるべきですか?

最後のオプションは、バックグラウンドの減算にはopencv、境界ボックスの生成にはRCNN、動物とバックグラウンドを識別する作物の分類モデルです。

答えて

1

一般に、「ネガティブ画像」を明示的に含める必要はありません。これらの検出モデルでは、注釈付きオブジェクトに属していない画像の部分をネガティブとして使用することがあります。

+0

対象オブジェクトなしのイメージに直面したときに、単一のクラス検出器が期待する動作は何ですか?低い確率のスコア?フレーム全体をカバーする境界ボックス? – bw4sz

+0

その場合の希望はボックスが返されないということです:) –

0

あなたのモデルでは、「図が見つかりました」と「図がありません」との区別が必要な場合は、ネガティブな例でトレーニングする必要があります。これらを「画像なし」と表示します。 「画像なし」の場合、はい、画像全体を境界ボックスとして使用します。モデルがもっと小さなものを認識することを示唆してはいけません。

より小さいバウンディングボックスを取得することはできますが、それは問題ではありません。推論では、「画像なし」と返されるボックスは無視されます。

もちろん、ここで重要な問題は、試してみることです。

関連する問題