私は簡単な実験を行っています。誰もが知っている可能性がありますcallback_metric CUPTIのサンプルコード(CUPTIフォルダにあります:/usr/local/cuda/extras/CUPTI/sample/callback_metric
)。これには、ベクトルのカーネルを実行しているときにメトリックを読み取るための単純なコードだけが含まれています。コードをコンパイルして実行すると、すべてが機能します。CUPTI関数を使用しているときにnvprofでcudaコードをプロファイルできません
しかし、私は nvprofコマンド(nvprof ./callback_metric
)の下で、このコードを実行すると、私のようにエラーメッセージが表示されます:
Error: incompatible CUDA driver version
nvprofおよびその他のCUPTIベースのコードの両方が個別に正常に動作します。