gpgpu

    0

    1答えて

    私はGLのTransformFeedback機能を使用しています。 1つのバッファの代わりに複数の出力バッファをバインドすることは可能ですか? out vec4 out0; out vec4 out1; そして、私は彼らのために2つのバッファオブジェクトを生成しています: glGenBuffers(1, &id0); glGenBuffers(1, &id1); 私はout1にout0

    0

    1答えて

    私はforループを持っています。ターゲットハードウェアがNVIDIAの場合はOpenACCと並列化し、ターゲットハードウェアがAMDの場合はシリアルに実行します。でコンパイル #pragma acc loop \ device_type(tesla) parallel \ device_type(radeon) seq for (int z = 0; z < size_z;

    0

    1答えて

    CUDAおよびGPGPUを初めて使用しています。私は数字の大規模なセットのプロパティをチェックしようとしています(32ビットより大きい)と私は、NVIDIAのGTX 1080を搭載した私のWindows 7 64ビットマシンを使用してこれを実行してみたいと思います: Detected 1 CUDA Capable device(s) Device 0: "GeForce GTX 1080"

    1

    1答えて

    私のホストプログラムがC言語であるとき、OpenCL関数の引数として2つのオプションを渡すことができます。例えば、私はこのようなclCreateBuffer関数に2つの フラグを渡すことができます。 clCreateBuffer(context, CL_MEM_READ_ONLY | CL_MEM_COPY_HOST_PTR, sizeof(main_data), mai

    -1

    1答えて

    私は最新のVulkan/Mantle/Direct3D12 APIについて話しています。コマンドのスクリプト化されたバッチへのバンドルは、1990年代から利点と考えられるはずの非常に単純な解決策であるようです。なぜそれを実装するか、それを思い付くのに時間がかかりましたか?

    1

    1答えて

    私はCUDAストリームとイベントについて読んでいました。以下のリンクのスレッドから、司会者が言った(私は引用しています): ストリームに提出されたコマンドは、順番に完了することが保証されています。アプリケーションがグリッドランチとイベントレコードをストリームに送信すると、ドライバはグリッドランチ、同期コマンド、およびイベントレコードを接続にプッシュします。フロントエンドは、カーネルの起動が完了して

    1

    1答えて

    私は5x5ガウスフィルタで画像を畳み込むOpenCLカーネルを作成していますが、フィルタ定数を保存するのがベストプラクティスであると思っていました。カーネル内の32×32のワークグループ内の各スレッドは、次のない: barrier(CLK_LOCAL_MEM_FENCE)、 介して同期の 、__localメモリバッファにピクセルをロードし、それが、対応するピクセルのための畳み込みを行います。ここで

    0

    1答えて

    __kernel void kmp(__global char pattern[1*4], __global char* string, __global int failure[1*4], __global int ret[1], int g_length, int l_length, int thread_num){ int pattern_num = 1; int pat

    1

    1答えて

    arrayfire pow documentationによれば、af.pow()は現在、実際の配列の累乗(およびルーツ...)のみをサポートしています。エラーはスローされませんが、複雑な入力を伴うaf.pow()を使用すると、特に他の関数が入力として使用されている場合(たとえば、af.pow(af.ifft(array), 2))、メモリリークが大きくなることがあります。 これを回避するために、私

    8

    2答えて

    私はC#ラッパーとしてCudafyを使用しています ビットマップのカラー情報InputBitmap0.GetPixel(x, y)を取得し、出力用に新しいビットマップを作成する必要があります。 私はGPUで以下の作業を行う必要があります。要するにCPU OutputBitmap.SetPixel(object_point_x, object_point_y, InputBitmap0.GetPix