2
cudaMallocPitchによって割り当てられたバイト単位で合計メモリを取得するにはどうすればよいですか?私はベースポインタとバイト数を期待するライブラリ(NvidiaのNCCL)を通してこのデータを別のGPUに送る必要があります。私は残念ながら私が使用することができないコピーのためのcudaMemcpy2D機能を認識しています。cudaMallocPitchによって割り当てられたメモリ(バイト単位)の計算方法