私は、異なるグリッドサイズで2回実行するカーネルを持っています。CUDA、cuPrintfが「不特定の起動失敗」を引き起こしますか?
私の問題はcuPrintfです。カーネルを実行する前にcudaPrintfInit()
がなく、カーネル実行後にcudaPrintfDisplay(stdout, true)
とcudaPrintfEnd()
がない場合、私はエラーはありませんが、そこに置くと「不特定の起動失敗」エラーが発生します。私のデバイスコードで
、このように一つだけのループは、印刷のためにそこにある:
if (threadIdx.x==0) {
cuPrintf("MAX:%f x:%d y:%d\n", maxVal, blockIdx.x, blockIdx.y);
}
私はCUDA能力を2.0とカードでCUDA 4.0を使用していますので、私はこの構文で私のコードをコンパイルしています:
nvcc LB2.0.cu -arch=compute_20 -code=sm_20