gpu-shared-memory

    1

    1答えて

    CUDA 2.0(NVIDIA 590)で大きな構造体の配列を処理しようとしています。私はそれのための共有メモリを使用したいと思います。私はCUDA占有計算機を試して、各スレッドが配列の要素全体を処理できるようにスレッドごとに最大共有メモリを割り当てようとしました。 しかし、計算機では100%のマルチプロセッサ負荷で最大32MBの(ブロックあたりの共有メモリ)/(1ブロックあたりのスレッド)は、単