私はGPUで縮小を実行しようとしています。つまり、配列のすべての要素から最大値を見つけることを試みています。 Nvidia hereからチュートリアルがあります。最も簡単な方法についてはスライド7としましょう10億要素の配列のGPU削減
私の唯一の問題は、配列が巨大であることです!それは40億要素に達することができます。スライド7のサンプルコードから、ブロック共有メモリとグローバルメモリの間で前後にコピーする必要があり、現在の理解ではすべての要素を格納するためのグローバルメモリの使用を避けることはできません。このストレージは、グラフィックスカードメモリの2GBを超えています。
このような巨大な配列でこの縮小を行う方法はありますか、それともグラフィックスハードウェアの現在の限界ですか?
PSは:将来の拡張版では、私はまた、
なぜGPUメモリに収まる入力データのチャンクを減らして実行するだけで、部分的な結果を減らして真の最大値を見つけることができないのですか? – talonmies
私は今や馬鹿だと感じています!おそらくこの質問を閉じるべきです。あなたのヒントをありがとう! –