0
カーネルごとにwarp_execution_efficiencyを得ることができますが、私のプログラムのwarp_execution_効率をどのように得ることができますか?CUDAワープ実行効率
カーネルごとにwarp_execution_efficiencyを得ることができますが、私のプログラムのwarp_execution_効率をどのように得ることができますか?CUDAワープ実行効率
注:すべてのカーネルで単一の数値を計算することは、最適化の目的には役立ちそうにありません。
NVIDIAのプロファイラはカーネル中心です。その情報を直接照会することは不可能です。しかし、nvprof --csv --metrics warp_execution_efficiency
を実行し、出力をExcel、R、または好きな統計ソフトウェアに入れてそこに混乱させることができます。
この問題の1つは、warp_execution_efficiencyに平均値が含まれているため、平均値を取ることができないことです。ビジュアルプロファイラーが提供していない便利なビジュアライゼーションを手に入れることができます。