gpu-shared-memory

1熱

1答えて

CUDAで100％MP負荷の最大（ブロックあたりの共有メモリ）/（ブロックあたりのスレッド）

CUDA 2.0（NVIDIA 590）で大きな構造体の配列を処理しようとしています。私はそれのための共有メモリを使用したいと思います。私はCUDA占有計算機を試して、各スレッドが配列の要素全体を処理できるようにスレッドごとに最大共有メモリを割り当てようとしました。しかし、計算機では100％のマルチプロセッサ負荷で最大32MBの（ブロックあたりの共有メモリ）/（1ブロックあたりのスレッド）は、単