19

私は、キーポイントの検出とマッチングにOpenCV 2.3を使用しています。しかし、私は少し検出アルゴリズムによって与えられたsizeresponseパラメータと混同しています。彼らはどういう意味ですか?サイズとレスポンスはSURFキーポイントで正確にどのように表現されますか?

OpenCVのマニュアルに基づいて、私はそれを把握することはできません。

float size:意味のあるキーポイント近所の直径

float response:最も強いキーポイントが選択され ていることにより、応答。さらに並べ替えやサブサンプリングに使用することができます

私は、最高の応答点が最も応答性の高い点であると考えましたが、そうではないようです。だから、どのようにして、サーフ検出器から返されたキーポイントのセットをサブサンプルして、追跡可能性の点で最良のものだけを保持することができますか?

答えて

59

サイズ及び応答

SURFは要するに、フィーチャのサイズは、ブロブのサイズであり、ブロブ検出器です。より正確に言えば、OpenCVによる返されるサイズは、近似されたヘッセ行列演算子の長さの半分です。このサイズは、スケールとも呼ばれ、これは、ブロブ検出器が動作する方法、すなわち、いくつかのスケールでガウシアンフィルタで画像を最初にぼかし、次に画像をダウンサンプリングし、最終的に固定サイズのブロブを検出することに機能的に等しいためである。 SURF機能のサイズを示す下の画像を参照してください。各フィーチャのサイズは描かれた円の半径です。フィーチャの中心から円周に出る線は、角度または向きを示す。この画像では、ブロブ検出フィルタの応答強度は色分けされている。検出されたフィーチャの大部分が弱いレスポンスを持つことがわかります。

SURF features

(フルサイズの画像hereを参照してください)このヒストグラムは、上記画像中の特徴の応答強度の分布を示しています

histogram showing distribution of response strengths

追跡するために、どのような機能?

最も堅牢な機能トラッカーは、検出されたすべての機能を追跡します。より多くの頑強さが特徴です。しかし、しばしば計算時間を制限したいので、多くの機能を追跡することは実用的ではありません。追跡するフィーチャの数は、アプリケーションごとに経験的に調整する必要があります。多くの場合、画像は規則的な小領域に分割され、各領域において、n個の最も強い特徴が追跡されている。 nは、通常、合計約500〜1000個の特徴がフレーム毎に検出されるように選択される。間違いなくjournal paper describing SURFを読む

参照

はあなたにそれがどのように動作するかの良いアイデアを与えるだろう。あなたの背景がマシン/コンピュータビジョンや画像処理に含まれていない場合には、細部にこだわらないようにしてください。 SURF検出器は一見すると非常に新規であるように見えるかもしれませんが、全体的なアイデアは積分画像(SURFよりずっと前の他の方法で使用されていた)を使ってヘッセ演算子(十分に確立されたフィルタ)を推定しています。 SURFをよく理解していて、画像処理に慣れていない場合は、戻って入門資料を読んでください。最近、私はa new and free bookに出くわしました。この章の13章では、機能の検出について簡単に紹介しています。技術的には正しいとは言えませんが、それは良い出発点です。 HereあなたはSURFの別の良い説明を見つけることができます。あなたはこの画像を見ているページで:

SURF blobs

あなたは白と黒の塊を見ることができ、これらは、SURFは、いくつかのスケールで検出し、それらのサイズ(OpenCVのコード内の半径)を推定するの塊です。

+0

非常に明確な答えです。どうもありがとう。私はSURFについてかなり知っているようですので、あなたにもう1つ質問したいと思います。 SURF検出器と抽出器について調べる価値のあるopencvマニュアルガイドに加えて、ドキュメントはありますか? – Tulkkas

+0

ようこそ。私はちょうどその答えを編集しました。 – fireant

+0

偉大なthx。私は実際にコンピュータサイエンスの背景を持っていましたが、SURFのopenCV実装についての情報がありました。関心のある人には、SURFのベースとなるSIFTについても説明しているこのWebサイト[リンク](http://www.aishack.in/2010/05/sift-scale-invariant-feature-transform/)もありました。 – Tulkkas

5
  1. 「サイズ」(故に、それが彼らのに基づいてキーポイントからキーポイントまで変化する、スケール空間内の原画像をダウンサンプリングすることによって、元の画像に記述によってカバーされる領域のサイズ取得されます規模)。

  2. "reponse"は、実際には「良い」(大雑把に言えばコーナリングの点で)ポイントを示しています。

  3. 優れた点は静的シーン検索で安定です(これはSIFT/SURF記述子の主な目的です)。トラッキングの場合、トラッキングされたオブジェクトが適切に形成された背景、影の半分、...この状態が変化したため消えます(光の変化、閉塞など)ので、良い点を表示できます。だから、良い点が常にそこにあることを追跡タスクのための保証はありません。

+0

良いキーポイントには大小の回答がありますか? –

関連する問題