現在、私はPythonバインディングClytherを介してOpenCLを発見しています。だから 私は非常に単純なスクリプトを使って65536のバッファの罪やコサインを得ることができます。 明らかに65536は私のカードのバッファの制限ですが、私のバッファには1600万の数字がありますデータを取得/送信するためにCPUを絶えず持ち込むことなく、Clyther/OpenCLで65536を超える処理バッファー
私がこれまで行ってきたことは、バッファを満たし、カーネルを実行し、バッファを取り出してループしていましたが、また がCPUをひどく打ちました。
私はOpenCLドキュメントを少し見ましたが、その達成方法を理解できませんでした。
あなたが__constant
メモリーを使用しているようにこれはひどく見えるあなた