1

私はNearest Neighbor問題について多くの論文を読んできました。ランダムなkd-treeやLSHのような索引付け技術は、高次元空間で動作するContent Based Image Retrieval(CBIR)にうまく使用されているようです。 1つの実際の一般的な実験には、SIFTクエリベクトルが与えられ、データセット内で最も類似したSIFT記述子が見つけられます。検出されたすべてのSIFT記述子を用いてプロセスを繰り返すと、最も類似した画像を見つけることができる。コンテンツベースイメージ検索(CBIR):機能または記述子の袋が一致していますか?

しかし、別の一般的な手法では、Bag of Visual Wordsを使用し、検出されたすべてのSIFT記述子を、巨大な疎ベクトルに変換します。これは、同じテキストテクニック(逆索引など)で索引付けできます。

私の質問は:これら2つの異なるアプローチが(SIFT記述子に特長の最近傍法VSバッグを通じてSIFT記述子をマッチングが+インデックスを反転)非常に異なっていて、私が優れている1理解していません。

2番目のアプローチが優れている場合は、コンピュータビジョン/画像処理でのネイバーネイバーの適用は何ですか?

答えて

1

オハイオ州の男の子、あなたは質問に答えることができないと私は思う。比較するためには、両方のアプローチの最先端技術を利用してそれらを比較し、速度、正確性およびリコールを測定する必要があります。最高の特性を持つものが他のものより優れています。

個人的には、私はビジュアルワードの袋をあまり聞いていなかったので、私は言葉のバッグをテキスト関連のプロジェクトでのみ使用しました。イメージ関連のものではありませんでした。さらに、私は多くの人々が第1のアプローチ(私と私たちを含むresearchを使用しているのを見てきたと確信しています)。私があなただったら、私はこの2つの方法を比較して、紙を探しますので、私が得た最高だし、私は1つを見つけることができなかった場合、私は両方のアプローチの最良の代表を(見つけるだろう


あなたが投稿したリンクに2009年の論文があります、それは私が推測している古いものです)、実験を確認してください。

しかし、注意してください!最良の代理人によるアプローチを比較するには、各論文の実験が超関連性があり、使用された機械が同じ「力」であり、使用されるデータが同じ性質とサイズであることを確認する必要があります。そうです。

+0

通常、私たちはCBIRについて話しているとき、イメージをSIFT記述子のセットとして単一ベクトル(例えばBoVWを通して)に変換せずに表現しています。 – justHelloWorld

+0

私はそれが私の答えに書かれているが、私が得たすべての@justHelloWorldを意味するか分からない;それが役に立てば幸い! :)それは良い質問だったBTW、私の+1に値する! – gsamaras

関連する問題