2012-01-17 6 views
1

プログラムをIDLからCUDAに変換して、256×256×nの密度のキューブを計算し、2次元画像をレンダリングします。前処理はまだIDL(密度キューブなどの読み込みなど)で行われ、その情報を(Cプログラムにcall_externalを使用して)ラッパー関数に渡し、CUDAを呼び出します。ラッパー関数によって呼び出されるCUDAプログラムにNVIDIA Visual Profilerを使用する

現在、私はプログラムを最適化しようとしており、NVIDIA Visual Profilerを使用して融合を確認したいと思っていました。これを行う方法があるのか​​どうか疑問に思っていました...視覚プロファイラを実行する方法プログラムのCUDA部分に電話する?

私は現在、CUDA関数にハードコードする変数が多すぎますが、IDLからCにCUDAに渡された値がなくても実行できないため、何もテストできません。

私はIDLを実行することができますので、IDLを実行して停止させてから、IDLを実行して自動的にすべてを実行するのではなくCのラッパー関数を手動で呼び出してください。

ありがとうございました

+0

IDLプログラムをビジュアルプロファイラで実行してみましたか?私はこれをpython + pyCUDA(pythonのいくつかのレイヤーを走らせてからカーネルを起動した)で実行しました。プロファイラーはカーネルを正常にプロファイリングしました。 –

答えて

0

ビジュアルプロファイラからアプリケーションを起動できます。それはとにかくCUDAコールをプロファイルするだけです。必要に応じて、プロファイリングの開始と終了ボタンを使用して、プロファイリングの開始と終了を制御できます。それはかなり簡単ですが、一般的に適用可能です。

+0

私はそれを働かせることができませんでしたが、私はこれを念頭に置いて続けます。 – HillaryD

関連する問題