1)、
get_global_size(0) gives number of items in x dimension
get_global_size(1) gives number of item arrays in y dimension
get_global_size(2) gives number of item matrices in z dimension
総数は、それらの乗算であるが、カーネルが起動された場合にのみ、1次元ののみ最初の機能は十分です。
get_local_size(0 or 1 or 2);
は、グループ内のアイテムではなく、アイテム全体で同じものを示します。
get_num_groups (0 or 1 or 2)
は、類似しているが、総グループ数が多い。
http://www.jocl.org/cloth/docs/doc-utils/org/jocl/utils/Events.html
computeExecutionTimeMs(org.jocl.cl_eventイベント) 計算実行時間:寸法の
数は、ホストコードから
int dims=get_work_dim()
2)イベントベースのパフォーマンスクエリから取得されミリ秒単位で指定します。
1)、2)、3)プロファイラ
は全て「各コア」を除いて表示します(ただし、すべての回で同じコアにマップされないことがあり、「レーン」の情報を提供しますが、あなたが見ることができることができるものをAシングルスレッドがやっていた)部分。 https://developer.nvidia.com/nvidia-nsight-visual-studio-editionビジュアルとテーブルは、ボトルネックやカーネルのホットスポット
ありがとうhttp://jocl.org/samples/JOCLEventSample.java – Marco13
で、イベントを使用してカーネルの実行時間を取得する方法を示す専用の例がありますについての十分な情報を与えますそれは有用です –