は、すべてのGPU-スレッドが例えば同じ時間複雑O.を有することが期待される:変換不規則でGPGPU: '不規則な'変換を処理する効果的な方法は?定期的な変換で
for i=0 to 10: c[i] = a[i]*b[i]
を、そうではない。ようなアレイをもたらす
for i=0 to len(arr)
for k=0 to random()%100
arr[i] += 1
[2,50,32,77,1,5,66、...]各要素は、おおよその計算コストを示します。
GPGPUプログラミングは、「要素別の追加」、「行列乗算」、「畳み込み」などの通常の変換によく適しています。 しかし、不規則な変換はどうですか? GPUスレッドを「うまく」配布する方法は?どのように '良い'カーネルを設計するのですか?共通の方法論はありますか?