0
は、だから私はそれが言うデバイス (同時カーネル実行)最大数
あたりと各計算機能のための常駐グリッドのこのwikipedia resource
最大数を見つけました並行カーネルの数。並列カーネルの最大数と仮定します。
this nvidia CUDA resourceによると、6.1の計算機能を持つGTX 1060が提供されています。これまでにCUDAについて学んだことから、フラグ
-arch=compute_XX
ではなく、NVCCのコンパイル時にコードの仮想計算機能を指定することができます。私のGPUはハードウェアで32個の同時カーネルに制限されているのですか、それとも
-arch=compute_60
フラグで128個の能力がありますか?
サイドノートでは、32個の並行カーネルがたくさんあり、この制限を打つことは本質的に不可能です。 GTX 1060には9個または10個のSMがあるので、3個のSMが1個の長いブロックを同時に起動する極端な場合でも、30個の同時カーネルにしか到達しません。 – tera
@tera – user2255757
@teraの追加情報ありがとうございました。動的並列処理とネストされたカーネルを使用する場合、並列カーネルの最大限の制限は同じですか? – user2255757