2013-03-05 7 views

答えて

5

__syncthreads() - >barrier(_)が、詳細はbarrier(CLK_LOCAL_MEM_FENCE)barrier(CLK_GLOBAL_MEM_FENCE) チェックこのquestionまたはこのdocumentationの違いを理解してください。

blockIdx.x - あなたのグループ/ブロックの最初/ X次元IDを与える>get_group_id(0)

のOpenCLにCUDAを移植するためにあなたを助けることができるウェブ上の多くのページがあります
0

(たとえばhere用)。私はちょうど、「障壁」のためにhereを指摘しているので、barrier(CLK_LOCAL_MEM_FENCE)barrier(CLK_GLOBAL_MEM_FENCE)があります。主に違いは、ローカル(CUDAで共有されている)メモリを使用している場合、グローバルメモリ上で動作しているときは2番目のものです。あなたのケースに合った正しいものを使用してください。

関連する問題