私のgpuブロックあたりの最大スレッド数は1024です。私はCUDAを使用している画像処理プロジェクトに取り組んでいます。共有メモリを使用したいのは、1つのブロックを使用して1024ピクセルしか使用できず、1024個の要素だけを共有メモリにコピーする必要があるということです。共有メモリに保持できるデータの量CUDA
-2
A
答えて
1
あなたの質問は非常に不明です。タイトルに尋ねられます。
CUDAの共有メモリに保持できるデータ量は、GPUの計算能力によって異なります。例えば は、CC 2.xおよび3.xで:計算能力2.xおよび3.xのデバイスで
、各マルチプロセッサは、L1キャッシュとの間で分配することができるオンチップメモリの64キロバイトを有し、かつ共有メモリ。
がここに共有メモリセクションの量の設定を参照してください:あなたがについて考える必要が最適化がメモリバンクへのスレッドのアクセスをマッピングすることにより、バンク競合を避けるためであるNvidia Parallel Forall Devblog : Using Shared Memory in CUDA C/C++
を。これはこのブログで紹介されており、あなたはそれについて読むべきです。
関連する問題
- 1. CUDAプログラミング - 共有メモリ構成
- 2. 大きなデータセットをループするときにメモリに保持するデータの量
- 3. cudaの共有メモリと管理対象メモリの変数
- 4. 共有機能オブジェクトをDjangoのメモリに保持するには?
- 5. 再起動時に共有メモリのデータを保持していますか?
- 6. 共有メモリにC++マップデータ構造を保持する方法は?
- 7. 共有CUDAメモリでvolatileを使用する場合
- 8. 2D共有メモリをCUDAに配置する方法
- 9. 共有メモリでのCUDA行列の転置
- 10. 共有メモリを持つクラウド
- 11. ローカルメモリはCUDAの共有メモリよりも遅いですか?
- 12. データ配信と共有メモリ
- 13. CUDA共有メモリの最大値を見つける
- 14. は2つのGPU共有メモリを処理できますか? (CUDA)
- 15. 静的対動的CUDA共有メモリ割り当てのパフォーマンス
- 16. CUDAでデータの配列とデータへのポインタのための共有メモリの動的割り当て
- 17. アプリケーション間のデータ共有 - 共有メモリとD-Busとファイル操作
- 18. CUDA - ダイナミック共有メモリがthrust :: system :: system_errorをトリガー
- 19. CUDA共有メモリ配列 - 奇妙な動作
- 20. Cudaから大きな可変量のメモリを転送する
- 21. 保護された共有メモリ?
- 22. uda共有メモリ上書き?
- 23. CUDA共有メモリが必要以上に2倍のスペースを占める
- 24. 単一メッセージ内にMQTTを保持できるデータ量は?
- 25. 単一メッセージでCoAPを保持できるデータの量は?
- 26. 共有メモリを持つ2D配列
- 27. 共有データベース/メモリ
- 28. RDMAメモリ共有
- 29. Win32共有メモリからデータを取得できません
- 30. 可変行列サイズのCUDAでの行列乗算と共有メモリの使用