CUDAの2つの2Dアレイをできるだけ高速に比較するアルゴリズムはありますか?その結果、私は等しい数の配列フィールドが必要です。CUDA 2つの2D配列を比較するにはどうすればよいですか?
ありがとうございました!
CUDAの2つの2Dアレイをできるだけ高速に比較するアルゴリズムはありますか?その結果、私は等しい数の配列フィールドが必要です。CUDA 2つの2D配列を比較するにはどうすればよいですか?
ありがとうございました!
2つの配列の間に等しい要素の数が必要な場合は、reduce操作を試してください。 NVIDIAのサイトには、reductionの例があります。通常の減算は、配列a
のすべての要素の合計を求めます。あなたが望むのは、すべての要素に対して式a == b
の合計です。 CUDA削減の実装に関する記事を参照する必要があります。
これらの操作については、http://code.google.com/p/thrust/をご覧ください。
有用な2つの操作は、boolean配列を構成するthrust :: transformと縮小を行うthrust :: count_ifです。想像的なイテレーターなどでより効率的なテクニックも可能です。チュートリアルをブラウズしてください。
壊れたリンク、悲しいです。 [This](http://developer.download.nvidia.com/compute/cuda/1.1-Beta/x86_website/projects/reduction/doc/reduction.pdf)、おそらく? –