2012-01-19 13 views
1

カーネル全体を繰り返し実行する必要性を避けるため、GPU全体の最大常駐ブロック数を決定できますか?GPU上の常駐ブロックの最大数にブロック数を最適化する

もっと正確には、部分的な結果をグローバルメモリにコピーするコストとカーネル実行のコストを避けたいと思います。したがって、仕事は各ブロックに均等に分配され、ブロックの1つが結果を見つけるまで、ブロックは計算をかなり交替させます。

ありがとうございます。

答えて

0

Thisスレッドがあなたの役に立つかもしれません。一般に、タスクが完全に並列であれば、残りのデータに対して新しいカーネルを起動する必要はありません。代わりに、カーネルの中でループすることができます。

+0

ありがとうございます、私は[occupancy calculator](http://www.google.si/url?sa=t&rct=j&q=occupancy%20calculator&source=web&cd=1&ved=0CCMQFjAA&url=http%3A%2F%2Fdeveloper.download .nvidia.com%2Fcompute%2Fcuda%2FCUDA_Occupancy_calculator.xls&ei = XQ4aT5iKE4qf-QbZg-ydCg&usg = AFQjCNG_VhxwvgVBBUZnnincdbTyvYLrKQ)GPUの実際の占有率を確認し、理想的なブロックサイズを決定し共有メモリを使用するのに非常に便利なツールです。 – stuhlo

関連する問題