は、マトリックス索引付けのこの正しい式です(dim3 threadBlock =(A、B、1)、dim3 blockGrid =(C、D、1)、A、B、C、Dはいくつかの数字です)。udaスレッド索引付け
int i = (blockIdx.y * gridDim.x + blockIdx.x) * blockDim.x + threadIdx.x;
int j = (blockIdx.x * gridDim.y + blockIdx.y) * blockDim.y + threadIdx.y;
1つのスレッド= 1つの行列アイテムが最速の方法ではありませんか? – user1281071
user1281071:あなたはあなたの質問で最も速い方法を求めませんでした:-)いずれの場合でも、最も速いインデックスはスピードの唯一の要因ではなく、カーネルで計算しようとするものにも依存します。 –
ok、sry :)私はシステムのようにしたいと思います:1つのスレッド= 1つの行列アイテムですが、上記の式が2次元ブロックとグリッドに対して正しいかどうかわかりません。 – user1281071