いくつかのデータをデバイスにコピーし、それぞれのストリーム上で複数のカーネルを呼び出し、異なるストリームに対してcudaMemcpyAsync
を呼び出してそれぞれのカーネルの後で実行する方法があります。CUDA:カーネル/ memcpyが終了する前にカーネル/ cudaMemcpyを呼び出すホストメソッドがありますか?
カーネルとcudaMemcpyAsync
の両方が起動され、ホストコードと並行して実行されていることを読んだので、これらの呼び出しが終了する前にそれらを呼び出すか、同じ機能のホストコードと並行して実行するか?