2
残念ながら、fermiベースのGPUは、異なるストリームの並行カーネルであっても、並列Nsightで直列化されたカーネルタイミングをトレースします。タイミング並列CUDAカーネル
タイマーを使用して、異なるストリームのカーネルの並行性を手動で表示する方法を提案できます。 Nsightでプロファイリング
乾杯 エド
残念ながら、fermiベースのGPUは、異なるストリームの並行カーネルであっても、並列Nsightで直列化されたカーネルタイミングをトレースします。タイミング並列CUDAカーネル
タイマーを使用して、異なるストリームのカーネルの並行性を手動で表示する方法を提案できます。 Nsightでプロファイリング
乾杯 エド
は現在、あなたがタイミングを追跡するためにイベントを使用する必要があります正確なタイミングを取得するので、同時カーネルを無効にしません。
期待どおりのイベントを使用することができ、cudaStreamWaitEvent()
を使用すると、別のストリームのイベントをストリームが待機するようにすることができます。詳細については、CUDA Reference Manualセクション4.5.2.5を参照してください。