6

既知のnVidia DetectNetよう - オブジェクト検出用のCNN(畳み込みニューラルネットワーク)をヨロ/ DenseBoxからのアプローチに基づいている:https://devblogs.nvidia.com/parallelforall/deep-learning-object-detection-digits/現代のCNN(畳み込みニューラルネットワーク)はDetectNetが不変のまま回転するので、

DetectNet人気GoogLeNetネットワークの拡張です。 の拡張は、YoloとDenseBox 論文で取られたアプローチに似ています。

そして、ここに示されているように、DetectNetは、任意の回転にオブジェクト(車)を検出することができますDetectNetは不変回転としてhttps://devblogs.nvidia.com/parallelforall/detectnet-deep-neural-network-object-detection-digits/

enter image description here

は、現代のCNN(畳み込みニューラルネットワーク)はありますか?

回転角度でオブジェクトを検出するために、同じ回転角度のオブジェクトで何千もの異なる画像にDetectNetを訓練できますか?

enter image description here

そして、何回転の不変について:DetectNetヨロ、ヨロv2では、DenseBoxそれに基づいて?

答えて

3

なし

CNNは回転不変ではありません。あなたは、すべての可能なローテーションであなたの訓練セットの画像を含める必要があります。

イメージをあらかじめ定義されたカテゴリに分類するようにCNNを訓練することができます(例のようにイメージ内の複数のオブジェクトを検出する場合は、分類子でイメージの各場所をスキャンする必要があります)。

CNNは、トレーニングデータの小さな水平または垂直の動きに対して不変です。

+0

あなたはスライディングウィンドウのアプローチについて話していますか? – mrgloom

+0

@mrgloom。それはスライディングウィンドウとは関係ありません。 – Kershaw

+0

@Kershawはあなたのクラシファイアで画像のすべての場所をスキャンします。 – mrgloom

1

ロブの答えに付け加えると、一般的にCNN自体は翻訳不変ですが、回転とスケールはありません。ただし、すべての回転をトレーニングデータに含めることは必須ではありません。最大プール層は回転不変を導入する。

This image投稿者Franck Dernoncourt hereあなたが探しているものかもしれません。第二に

、言うロブの答えにカーショウさんのコメントについて:

CNNが主な理由は、最大プールのトレーニングデータの小さな水平または垂直の動きに対して不変です。

CNNが翻訳不変である主な理由は、畳み込みです。フィルタは画像全体に移動するため、フィルタは画像内の位置に関係なくそのフィーチャを抽出します。フィーチャのピクセル表現の違いのためにフィルタが失敗するのは、画像が回転または拡大縮小されたときです。

出典:Aditya Kumar Praharajの答えはthis linkです。

関連する問題