距離行列(ユークリッド)を使用する場合、データセット(ほとんどの次元で複数のゼロ値)でスパース性が検索効率または精度にどのように影響するかをお尋ねします。私はANNとFLANNでこのような疎なデータセットをテストしましたが、密なデータセットと比較して、最も近い近隣を検索するのは非常に長い時間でした。なぜこれはそうですか?データマイニングにおけるデータセットのスパース性の影響
2
A
答えて
2
これは非常に幅広い質問であり、具体的な説明がなくても答えにくいです。しかし、私はそれを試してみましょう。
ユークリッド空間の最近傍を求めるには一般に、約m * n回の計算が必要です。ここで、mは次元数、nはサンプル数です。各データセットの時間統計をm * nでプロットし、それらの比較方法を見ることができます。
スパースデータセットの場合は、サンプルを辞書形式で保存することもできます。その場合、平均時間はおおよそk * logk * nの計算になります。ここでkは非ゼロ要素の平均数です(辞書が各機能のランダムアクセス時間がlogkになるように格納されていると仮定します)。 logkの部分はほとんど目立たない)。
0
これは実装によって大きく異なります。あなたは何を使用しますか?例えば、距離計算に疎最適化を使用しますか?ユークリッド距離は、スパースベクトルの最も合理的な距離ではありません。
関連する問題
- 1. MS09-035アプリケーション開発における脆弱性と影響
- 2. .NET 4.0におけるCASポリシーの変更の影響?
- 3. アルゴリズムの複雑さにおけるメモリ使用の影響
- 4. 高速フーリエ変換におけるデータ間隔の影響
- 5. 既存のデータアクセスオブジェクトクラスにおけるApache Shiroの役割とアクセス許可の影響
- 6. スパース行列はどのようにメモリ使用量に影響しますか?
- 7. ActiveMQのセッションAUTO_ACKNOWLEDGE特性への影響
- 8. ボタンの影響を受けるキーダウンイベント
- 9. ロードリストへの影響を避ける
- 10. スプリットRにおけるデータセット
- 11. データセットで最も影響を受けるパラメータを特定する方法
- 12. 2つのベクトルの類似性に対するパディングの影響
- 13. UIScrollViewの影響を受けないビュー
- 14. お互いに影響を与えるAndroidの画像
- 15. AngularJSお互いに影響を与える2つの時計
- 16. iTerm2トリガーケースに影響を受けない
- 17. ADODBの影響を受けた行がトリガの影響を受ける行を返します
- 18. OSGiと永続性のモジュール性:関係の影響
- 19. 私はCSSの影響を受けたくない画像は、それの影響を受けています
- 20. 型の等価性にint配列のサイズの影響
- 21. のHandleError属性は私のweb.configファイルには何の影響も
- 22. 有効性の正確性/損失がcaffeのトレーニングに影響するか
- 23. Vector3の方向は影響に影響しません
- 24. 影響
- 25. 影響
- 26. 話者の長さが話者認識におけるニューラルネットワークにどのように影響するか?
- 27. 実際のパラメータのパフォーマンスの影響の影響
- 28. データマイニングの町および都市名
- 29. TFS 2013にのみ影響を受ける実行テスト
- 30. 0 MySQLのUPDATE文に影響を受ける行
i a.m優先順位の高い検索ツリーを持つランダム化されたk-dツリーを使用すると、スパースな最適化は実装されません。なぜユークリッド距離はまばらなベクトルではうまくいかないのですか? – Tian