3Dで何千もの点のコレクションが与えられていると、(粒子のユークリッド距離に関して)いくつかのカットオフ値に入る各粒子の近隣のリストを取得し、最も近いfoから最も離れてソートされます。隣人のリストを計算するための最善のGPUアルゴリズム
この目的のために、CUDAまたはOpenCL言語で最も高速なGPUアルゴリズムはどれですか?
3Dで何千もの点のコレクションが与えられていると、(粒子のユークリッド距離に関して)いくつかのカットオフ値に入る各粒子の近隣のリストを取得し、最も近いfoから最も離れてソートされます。隣人のリストを計算するための最善のGPUアルゴリズム
この目的のために、CUDAまたはOpenCL言語で最も高速なGPUアルゴリズムはどれですか?
私が気付いている最も速いGPU MDコードの1つであるHALMDは、CUDA SDK examplesで使用されているのと同じ種類のアプローチ(高度に調整された)の「パーティクル」を使用しています。 HALMD紙と粒子の両方whitepaperは非常にはっきりと書かれています。アンダーリングアルゴリズムは、粒子をカットオフ半径サイズのビンに割り当て、そのインデックスに基づいて基数ソートを行い、次に隣接ビン内のパーティクルを見ることです。
これは紙が実際によく説明されており、すべての機能やものが既にライブラリに実装されているので、これは本当にクールです! – flow
CUDAとOpenCLはアルゴリズムではなく、GPUをプログラムできるテクノロジです。
いずれも問題を解決するのに適しています。私があなただったら、私はこれらの技術を使用してプログラムを書くようなものだ何を感じ、その後、興味のあるアルゴリズムを実装するものを選択するためにソースコードの例になります。
私はちょうどそれを正しく表現していないことを知っています。 – flow
Fast k Nearest Neighbor Search using GPU
私は、テストに使用していませんそれは何もない。私はグーグルで見つけた最初のリンクを投稿しました。
あなたはCUDAとOpenCLが何であるか誤解していると思います。 –
私は質問に言い換えた – flow
すべての粒子のカットオフ値は同じですか? –