3x3行列と360x360行列の間の行列乗算をしようとしています。小さな行列(3x3)は、大きな行列の最初の(3x3)ブロックなどで操作されます。したがって、私は小さな行列を定数にして、それをより大きな行列にスライドさせたいと思います。cuda:共有とグローバルを使用した行列乗算
私の小さなマトリックスを共有メモリの一部として保存し、私の大きなマトリックスを3x3に分けてグローバルにすることはできますか?
小さな行列をホストから直接共有する方法を見つけることができません。クンダの視覚化が間違っていれば、どうか私を修正してください。
ありがとうございました。
あなたがすることはできませんホストから共有メモリにコピーします。これはサポートされていません。 – talonmies