opencl

0熱

1答えて

OpenCL 1.2でサポートされている#pragma OPENCL EXTENSION cl_khr_fp16 : enableのGPUを使用しています。以下に示すように、私は私のデバイスカーネルで32から16にフロート精度をCHANGINによって性能改善を確認したかった、私はhalfに全てfloat変換： __kernel void copy_kernel(int N, __global ha

0熱

1答えて

バッファの引数を設定するときのCL_INVALID_ARG_VALUE

私はOpenCLプログラムを書いていますが、バッファをすべてゼロとして読み込んでいます。インテルSDKのトレースに目を通すと、バッファ引数を設定するときにCL_INVALID_ARG_VALUEが得られることがわかりました。（スカラー引数を設定してもエラーは発生しません）私はOpenCL C++バインディング（cl.hpp）を使用しています。私のコードは長いので、テストプログラムで問題を再現

0熱

1答えて

OpenClアルゴリズムの実装結果が異なります

問題があります。私はOpenClを学ぼうとしているので、OpenClでFFTアルゴリズムを実装しようとしています。私はこれを再作成しようとしていた： void FFT (cmplx* data, int dataSize){ if(dataSize == 1){ return; }else{ cmplx* even = (cmplx*)malloc(da

1熱

1答えて

OpenCLの文字をグローバルからローカルメモリ

OpenCLテクノロジーでsha512を実装しています。私はカーネル関数の簡単な定義を持っています __kernel void _sha512(__global char *message, const uint length, __global char *hash); 私は実装して正常にsha512アルゴリズムの実装をテストしました。 message配列からcharacterという一時変数

0熱

1答えて

FPGA上のOpenCL単一作業項目VS NDRangeカーネル

私はOpenCLを初めて使用し、FPGA上でOpenCLを使用してブロック暗号の暗号化に取り組んでいます。私はいくつかの論文を読んで、Openclには2種類のカーネルがあることを知っています（単一のワークアイテムとNDRange）。 NDRangeカーネルの機能はコンパイラによって自動的にパイプライン化されるのではなく、単一のワークアイテムカーネルの機能が自動的にパイプライン化されます。 FPGA

0熱

1答えて

OpenCLから生成されたPTXバイナリで不要なCVT命令

本当にシンプルなOpenCLコードを作成し、Tesla K40m GPUで実行してGFlopsを測定しようとしました。ここで私が書いたコードは次のとおりです。 __kernel void test(__global float *GIn, __global float *GOut, int M, int N, int P) { int X = get_global_id(0);

4熱

1答えて

（GPUのコードで）「のif-else」文は半分

でパフォーマンスをカットしますなぜ私がこの記事を読んで： FPGA or GPU? - The evolution continues を誰かが彼が書いているコメントを追加しました： GPUはSIMDなので、 "if-else"ステートメントのコードでは、のパフォーマンスが半減します。コアの半分がステートメントのif部分を実行し、残りの半分のコアがアイドル状態のまま残り、コアの最初の半分がア

0熱

2答えて

AndroidでのOpenCLのサポート

私はOpenCLの反対意見を公開しているhereを読みました。別のスレッドでは、why Google choose RenderScript instead of OpenCL.の両方の投稿は古いです。最近のAndroidバージョン（N、O）にはOpenCLのサポートが含まれていますか？