私はNearest Neighbor問題について多くの論文を読んできました。ランダムなkd-treeやLSHのような索引付け技術は、高次元空間で動作するContent Based Image Retrieval(CBIR)にうまく使用されているようです。 1つの実際の一般的な実験には、SIFTクエリベクトルが与えられ、データセット内で最も類似したSIFT記述子が見つけられます。検出されたすべてのSIFT記述子を用いてプロセスを繰り返すと、最も類似した画像を見つけることができる。コンテンツベースイメージ検索(CBIR):機能または記述子の袋が一致していますか?
しかし、別の一般的な手法では、Bag of Visual Wordsを使用し、検出されたすべてのSIFT記述子を、巨大な疎ベクトルに変換します。これは、同じテキストテクニック(逆索引など)で索引付けできます。
私の質問は:これら2つの異なるアプローチが(SIFT記述子に特長の最近傍法VSバッグを通じてSIFT記述子をマッチングが+インデックスを反転)非常に異なっていて、私が優れている1理解していません。
2番目のアプローチが優れている場合は、コンピュータビジョン/画像処理でのネイバーネイバーの適用は何ですか?
通常、私たちはCBIRについて話しているとき、イメージをSIFT記述子のセットとして単一ベクトル(例えばBoVWを通して)に変換せずに表現しています。 – justHelloWorld
私はそれが私の答えに書かれているが、私が得たすべての@justHelloWorldを意味するか分からない;それが役に立てば幸い! :)それは良い質問だったBTW、私の+1に値する! – gsamaras