あなたは、コアの数、計算ユニットの数だけを照会することはできません。インテルの統合GPUは、一般的に計算ユニットあたり8コアしかなく、Nvidiaは計算ユニットあたり192コアまたは128コアを搭載しています。 Max_compute_unitsは計算単位の数であり、パーティションを見つける(そして制限する)ためにデバイスパーティションで使用できるはずですが、通常はデバイスパーティショニングにはCPUだけがサポートされています。
パラレルで実行できるプロセス(作業項目)の数は、ハードウェアの能力によって異なります。 AMDグラフィックスカードの場合、コアの数の40倍(計算ユニットの数の64倍)があります。たとえば、8つのコンピューティングユニットAMD GPUは、飛行中に20k(8 * 64 * 40)スレッドを持つことができ、さらに多くのキューを1つのキューに入れることができます。
最大計算ユニット数はドライバから変更することができますが、ベータドライバで12個にもかかわらず8個のコンピューティングユニットしか表示されていないインテルGPUが搭載されています。また、AMD GPUは、一部のアプリケーションではオーディオコンピューティングを使用するため、汎用コンピューティングカーネルでは、それらのアプリ内の残りの計算ユニットのみが表示されることがあります。
Nvidia GPUには13個の計算ユニットしかなく、ドライバが計算に13個しか使用できない場合は、OpenCLでは13個すべてを使用できます。 GTX970には、Intel Iris GPUよりも多くのコアが搭載されています。
エンキューされたOpenCLカーネルのワークグループは、計算単位ごとに実行されるため、各ワークグループのワークアイテムは、同じワークグループ内の他のワークアイテムと計算ユニットの同じメモリを共有します。しかし、一部のベンダーは規則を少しでも拡張することができます。単一のワークグループに対してComputeユニットを共同で使用することができます。インテルigpuなど。
GPUには13個の計算ユニット(NVIDIAの用語でストリーミングマルチプロセッサ)が搭載されているためです。 – talonmies
[ワークグループの数に対応する計算ユニットの数]の可能な複製(http://stackoverflow.com/questions/9326430/number-of-compute-units-corresponding-to-number-of-work-グループ) – talonmies