プログラムをIDLからCUDAに変換して、256×256×nの密度のキューブを計算し、2次元画像をレンダリングします。前処理はまだIDL(密度キューブなどの読み込みなど)で行われ、その情報を(Cプログラムにcall_externalを使用して)ラッパー関数に渡し、CUDAを呼び出します。ラッパー関数によって呼び出されるCUDAプログラムにNVIDIA Visual Profilerを使用する
現在、私はプログラムを最適化しようとしており、NVIDIA Visual Profilerを使用して融合を確認したいと思っていました。これを行う方法があるのかどうか疑問に思っていました...視覚プロファイラを実行する方法プログラムのCUDA部分に電話する?
私は現在、CUDA関数にハードコードする変数が多すぎますが、IDLからCにCUDAに渡された値がなくても実行できないため、何もテストできません。
私はIDLを実行することができますので、IDLを実行して停止させてから、IDLを実行して自動的にすべてを実行するのではなくCのラッパー関数を手動で呼び出してください。
ありがとうございました
IDLプログラムをビジュアルプロファイラで実行してみましたか?私はこれをpython + pyCUDA(pythonのいくつかのレイヤーを走らせてからカーネルを起動した)で実行しました。プロファイラーはカーネルを正常にプロファイリングしました。 –