0
新しい累積合計行列の各インデックス(i、j)の値がサブによって形成されるすべての要素の合計であるマトリックスの累積合計を計算する必要があります元の行列の(0,0)〜(i、j) CUDAの複数のスレッドを使用して並列化する方法はありますか?CUDAでマトリックスのランニング和を並列化する
新しい累積合計行列の各インデックス(i、j)の値がサブによって形成されるすべての要素の合計であるマトリックスの累積合計を計算する必要があります元の行列の(0,0)〜(i、j) CUDAの複数のスレッドを使用して並列化する方法はありますか?CUDAでマトリックスのランニング和を並列化する
累積合計はスキャンであり、CUDA SDKには「スキャン」の例が含まれています。 ScanLargeArrayの例を確認してください。これは非常に高度に洗練されたアルゴリズムであり、アルゴリズムを最適化するために取られたすべてのステップを記述する論文でさえもhttp://developer.download.nvidia.com/compute/cuda/1_1/Website/projects/scan/doc/scan.pdfです。
CUDAパラレルプレフィックス合計のBing。 –