なぜコンピュータビジョンでBag of Wordsのアプローチを選択するのですか?コンピュータビジョンで言葉の語彙を使用する理由
たとえば、記述子としてHOG機能を使用し、この機能にBOWアプローチを適用すると、結果はヒストグラムのヒストグラムになります。
私はこのアプローチで次元削減の利点を見ることができますまた、生成されたビンの固定サイズが、これは本当に唯一の理由ですか?この減少はまた、情報の損失を引き起こす。
また、画像を一定のサイズ、通常はより小さなサイズにリサイズし、HOGを計算することも考えられます。結果として得られるベクトルも固定されたサイズになるので、分類子とともに使用することもできます。これは、特に固定画像のサイズが非常に小さい場合には情報の損失を招くことになるが、k手段の場合ほど劇的ではない。
これは完全に理にかなっています。ありがとう! –