2017-08-11 9 views
0

なぜコンピュータビジョンでBag of Wordsのアプローチを選択するのですか?コンピュータビジョンで言葉の語彙を使用する理由

たとえば、記述子としてHOG機能を使用し、この機能にBOWアプローチを適用すると、結果はヒストグラムのヒストグラムになります。

私はこのアプローチで次元削減の利点を見ることができますまた、生成されたビンの固定サイズが、これは本当に唯一の理由ですか?この減少はまた、情報の損失を引き起こす。

また、画像を一定のサイズ、通常はより小さなサイズにリサイズし、HOGを計算することも考えられます。結果として得られるベクトルも固定されたサイズになるので、分類子とともに使用することもできます。これは、特に固定画像のサイズが非常に小さい場合には情報の損失を招くことになるが、k手段の場合ほど劇的ではない。

答えて

1

低レベルのフィーチャディテクタは小さな「関連性のある」パッチを見つけて、ディスクリプタ+ k-meansアルゴリズムはそれらを "ヘッドライト"、 "タイヤ"、 "車の屋根 "です。次に、ヘッドライトのペア、タイヤ2つ、車の屋根を見つけたら、おそらく車を見ているでしょう。

利点は重要ではないということです。ここで、タイヤとヘッドライトはです。車の側面図や正面図、別のモデルを見ても問題ありません。フィーチャ記述子をイメージ全体に直接適用すると、サイドビューと正面ビューはまったく異なる説明を取得します。

+0

これは完全に理にかなっています。ありがとう! –

関連する問題