2016-11-22 14 views
-2

私のgpuブロックあたりの最大スレッド数は1024です。私はCUDAを使用している画像処理プロジェクトに取り組んでいます。共有メモリを使用したいのは、1つのブロックを使用して1024ピクセルしか使用できず、1024個の要素だけを共有メモリにコピーする必要があるということです。共有メモリに保持できるデータの量CUDA

答えて

1

あなたの質問は非常に不明です。タイトルに尋ねられます。

CUDAの共有メモリに保持できるデータ量は、GPUの計算能力によって異なります。例えば は、CC 2.xおよび3.xで:計算能力2.xおよび3.xのデバイスで

、各マルチプロセッサは、L1キャッシュとの間で分配することができるオンチップメモリ​​の64キロバイトを有し、かつ共有メモリ。

がここに共有メモリセクションの量の設定を参照してください:あなたがについて考える必要が最適化がメモリバンクへのスレッドのアクセスをマッピングすることにより、バンク競合を避けるためであるNvidia Parallel Forall Devblog : Using Shared Memory in CUDA C/C++

を。これはこのブログで紹介されており、あなたはそれについて読むべきです。

関連する問題