opencl

    0

    1答えて

    OpenCL 1.2でサポートされている#pragma OPENCL EXTENSION cl_khr_fp16 : enableのGPUを使用しています。以下に示すように、私は私のデバイスカーネルで32から16にフロート精度をCHANGINによって性能改善を確認したかった、私はhalfに全てfloat変換: __kernel void copy_kernel(int N, __global ha

    0

    1答えて

    私はOpenCLプログラムを書いていますが、バッファをすべてゼロとして読み込んでいます。インテルSDKのトレースに目を通すと、バッファ引数を設定するときにCL_INVALID_ARG_VALUEが得られることがわかりました。 (スカラー引数を設定してもエラーは発生しません) 私はOpenCL C++バインディング(cl.hpp)を使用しています。 私のコードは長いので、テストプログラムで問題を再現

    0

    1答えて

    問題があります。私はOpenClを学ぼうとしているので、OpenClでFFTアルゴリズムを実装しようとしています。私はこれを再作成しようとしていた: void FFT (cmplx* data, int dataSize){ if(dataSize == 1){ return; }else{ cmplx* even = (cmplx*)malloc(da

    1

    1答えて

    OpenCLテクノロジーでsha512を実装しています。私はカーネル関数の簡単な定義を持っています __kernel void _sha512(__global char *message, const uint length, __global char *hash); 私は実装して正常にsha512アルゴリズムの実装をテストしました。 message配列からcharacterという一時変数

    0

    1答えて

    私はOpenCLを初めて使用し、FPGA上でOpenCLを使用してブロック暗号の暗号化に取り組んでいます。私はいくつかの論文を読んで、Openclには2種類のカーネルがあることを知っています(単一のワークアイテムとNDRange)。 NDRangeカーネルの機能はコンパイラによって自動的にパイプライン化されるのではなく、単一のワークアイテムカーネルの機能が自動的にパイプライン化されます。 FPGA

    0

    1答えて

    本当にシンプルなOpenCLコードを作成し、Tesla K40m GPUで実行してGFlopsを測定しようとしました。ここで私が書いたコードは次のとおりです。 __kernel void test(__global float *GIn, __global float *GOut, int M, int N, int P) { int X = get_global_id(0);

    4

    1答えて

    でパフォーマンスをカットしますなぜ私がこの記事を読んで: FPGA or GPU? - The evolution continues を誰かが彼が書いているコメントを追加しました: GPUはSIMDなので、 "if-else"ステートメントのコードでは、 のパフォーマンスが半減します。コアの半分が ステートメントのif部分を実行し、残りの半分のコアがアイドル状態のまま残り、 コアの最初の半分がア

    0

    2答えて

    私はOpenCLの反対意見を公開しているhereを読みました。別のスレッドでは、why Google choose RenderScript instead of OpenCL.の両方の投稿は古いです。 最近のAndroidバージョン(N、O)にはOpenCLのサポートが含まれていますか?