2010-12-17 4 views
0

現在、私はPythonバインディングClytherを介してOpenCLを発見しています。だから 私は非常に単純なスクリプトを使って65536のバッファの罪やコサインを得ることができます。 明らかに65536は私のカードのバッファの制限ですが、私のバッファには1600万の数字がありますデータを取得/送信するためにCPUを絶えず持ち込むことなく、Clyther/OpenCLで65536を超える処理バッファー

私がこれまで行ってきたことは、バッファを満たし、カーネルを実行し、バッファを取り出してループしていましたが、また がCPUをひどく打ちました。

私はOpenCLドキュメントを少し見ましたが、その達成方法を理解できませんでした。

あなたが__constantメモリーを使用しているようにこれはひどく見えるあなた

答えて

2

ありがとうございます。解決策は代わりにメモリ__globalを使用することですが、最高のパフォーマンスのためにアクセスする方法に注意する必要があります。

__constantメモリがしばしば使用される定数値のための特別なアドレス空間であるが、現在のGPU上でのサイズに制限されています。

関連する問題