2
私は、マークハリスによるCUDAの並列リダクションの最適化に関するプレゼンテーションを読んでいました。ここで私は問題を持っているスライドです:インターリーブドアドレッシング法を使用したバンクリダクションの並列化
は、それは、この方法では、バンク競合の問題があると言います。しかし、なぜ?すべてのスレッドは、異なるバンクにある2つの連続するメモリセルにアクセスしています。どちらも特定のメモリセルに同時にアクセスしません。