私はOpenCL
コードを書いて、GPUで最大の占有率を持つ最適なワークグループサイズを見つけました。このためには、計算単位あたりの最大作業項目数を返す関数が必要です。コンピューティングユニットあたりのOpenCl最大作業項目
基本的に私はこれをCUDA
コードから派生しており、maxThreadsPerMultiProcessor
の同等物が欲しいです。マルチプロセッサあたりのスレッドの 最大数:CUDAで は、これらは、デバイスのクエリに返された値であった2048年ブロックあたりのスレッドの 最大数:OpenCLの1024
: CL_DEVICE_MAX_WORK_GROUP_SIZE:CUDA 1024
それはdoesnのtはこの値を返すカーネル情報を要求します。 OpenCLに相当する機能が必要です。 ありがとうございます。