2011-12-08 6 views

答えて

20

明らかな違いは、密集したSIFTでは、すべての場所で というSIFT記述子が得られますが、通常のふるい分けでは、Loweのアルゴリズムで決定された 位置でSIFT記述が得られます。

高密度でないSIFTを必要とするアプリケーションがたくさんあります.1つの大きな例がLoweのオリジナル作品です。

記述子をどこでも(密に)計算すると良い結果が得られたアプリケーションがたくさんあります。そのような例の1つはthisです。高密度SIFTに似た記述子はHOGまたはDHOGと呼ばれ、技術的には同じではありませんが、概念的には勾配のヒストグラムに基づいており、非常に似ています。

+3

これは良い答えですが、HOGと呼ばれている高密度のSIFTについての発言は間違っています。両方とも勾配ビンに基づいていますが、HOGとSIFTは2つの異なる記述子です(HOGは通常高密度でサンプリングされますが、稠密かどうか)。 – Jotaf

+0

@Jotaf:そうです、私はあまり単純化していませんでした。私は私の答えを少し編集しました。 – carlosdc

+0

各ポイントで元のSIFTを計算すると、denseSIFTが得られません。http://www.vlfeat.org/overview/dsift.html – mrgloom

2

一般に、一般的なオブジェクトカテゴリ認識では、キーポイントベースのフィーチャ抽出ではなく、密なフィーチャ抽出を使用してより良い結果が得られます。

2

http://www.vlfeat.org/overview/dsift.htmlには、SIFT実装と密集SIFT実装の両方でイメージフィーチャがどのように抽出され、それらの実行時間の比較がどのように抽出されるかが詳細に分かります。 VLFeat密度の高いSIFT記述子の主な利点は速度です。

MediaMixer Deliverable D1.1.2では、SIFT記述子と密なSIFT記述子の両方を使用するコンセプト検出手法が提示されており、この組み合わせによってより正確な分類が行われることが示されています。詳細については、http://community.mediamixer.eu/のMediaMixerコミュニティポータルに参加できます。

1

高密度SIFTは、画像内の各場所とスケールでより多くの特徴を収集し、それに応じて認識精度を高めます。しかし、(通常のSIFTとの関連で)計算上の複雑さが常に問題になります。

分類にSIFTを使用している場合は、単一の線形カーネル関数を使用してDense SIFTを使用することに反対する複数のカーネル関数(クラスタリング用)で通常のSIFTを使用することをお勧めします。あなたは明白なスピード/正確さのトレードオフを得るでしょう。

Big-Ohの実装の違いを説明しているthisの記事をチェックすることをおすすめします。

+0

クラスタリングのステップを控えてください。 – mrgloom

関連する問題