0

ANN検索は、効率の面でNN検索より優れていることが知られており、一部の手法では、コンパクト表現からストレージスペースが削減されます。しかし効果の点ではどうなるでしょうか?徹底的な検索で最も近いネイバーを見つけずに同じパフォーマンスを達成することは可能ですか?ANN検索は、高次元表現を持つ大規模データベースでNN検索の精度を上回ることはできますか?

答えて

0

私はip2locationデータベースでバイナリ検索とアン検索を試みました。速度は同じですが、多くの最適化があります。ソースコードはhttps://ip2locationphp.codeplex.com/にあります。

1

有効性とは正確度(正確な最近隣を見つける)、次になしを意味します。 NN検索では常に正確なNNが検索されますが、ANN検索ではNN検索の結果との結びつきである正確なNNが検索されます。

しかし、高次元空間において、次元の呪いが潜んおよび2Dおよび3Dのための通常のデータ構造及びアルゴリズムは力まかせ探索ほど遅くなる傾向があり、従ってANN探索が移動するための方法でありますあなた(大きい)データが高次元の空間に住んでいるとき。

+0

私はあなたに同意しますが、100%ではありません。正確なNNを話すとき、これは実際のNNである必要はなく、私たちの精度はまだ100%ではありません。これは、検索がデータに使用された表現の影響を受けるためです。 質問の焦点を変更して、ANN検索を通じて、正確性に影響を与える誤検出を排除することが可能かどうかを判断することができます。 – jperezmartin

+0

あなたがデータを圧縮していれば、その表現は精度に影響するかもしれませんが、それは正確なNNの問題ではありません。私はそれが実際のANNだということを意味しますが、それはすべて視点に依存します! @jperezmartin答えが役立つことを願っています! =)投稿された質問は素晴らしいBTWでした! – gsamaras

関連する問題