6熱
1答えて
ループを展開し、ベクトル化を使って独立した和を計算する
0熱
1つのファイルにループを展開する
2答えて
移植ダフのデバイス
カーネルを最適化するためにPTXを調べるべきでしょうか?もしそうなら、どうですか?
7熱
GCCにこのループを完全に展開するよう依頼する方法(つまり、このループをはがす)?
8熱
必要に応じてGLSLシェーダがアンロールループにならない