opencvでopenclを使うには

OpenCVを使って1つの画像を開きますので、OpenCLを使って領域を描くアルゴリズムを作成しようとしています。問題は、データをOpenCLに変換する方法です。opencvでopenclを使うには

私はOpenCVのバージョンを使用しています：2.4.9とのOpenCL：Visual StudioでAMD APP SDK \ 2.9-1

誰かが私が

2017-07-04 user7381415

一般的に何をすべきかのOpenCVを使用して画像をopenning後に私に言うだろうOpenCLアプリケーションのホストプログラムからデバイスプログラムに画像（または他のデータ）を転送するには、2つの方法があります。1 - バッファの使用2- Image2dの使用。どちらもcl_memタイプを使用しています。バッファの使用はimage2d（特にグレースケール画像）を使用するより簡単ですので、OpenCLのバッファを使って画像をホストプログラムからデバイスに転送する方法を説明します。

入力画像をopenCVオブジェクトMatで読み取った後、グレースケール画像に変換します。次に、cl_memバッファを返すメソッドclCreateBufferを使用します。 data（Matオブジェクトのプロパティ）をclCreateBufferに渡すだけで、入力画像データで入力カーネルバッファを初期化できます。次に、作成したバッファをclSetKernelArgメソッドを使用してカーネルに転送することができます。最後に、カーネルが仕事を終えると、結果はclEnqueueReadBufferで読むことができます。

このコードを理解するためにコメントを読んだり、躊躇したりすることはありません。

ホストコード：

// Make Contex, Kerenl and other requirements for OpenCL before this section.... 

Mat image = imread("logo.bmp", CV_LOAD_IMAGE_COLOR); // reading input image by opencv to Mat type 
Mat input_; 

cvtColor(image, input_, CV_BGR2GRAY); // convert input image to gray scale 

cl_mem inputSignalBuffer = clCreateBuffer(
     context, 
     CL_MEM_READ_ONLY | CL_MEM_COPY_HOST_PTR, 
     input_.rows * input_.cols * input_.elemSize(), 
     static_cast<void *>(input_.data),    // inputSignalBuffers will be initialized by input_.data which contains input image data 
     &errNum); 

cl_mem outputSignalBuffer = clCreateBuffer(  // make and preparing an empty output buffer to use after opencl kernel call back 
     context, 
     CL_MEM_WRITE_ONLY, 
     input_.rows * input_.cols * input_.elemSize(), 
     NULL, 
     &errNum); 
    checkErr(errNum, "clCreateBuffer(outputSignal)"); 


    errNum = clSetKernelArg(kernel, 0, sizeof(cl_mem), &inputSignalBuffer); // passing input buffer and output buffer to kernel in order to be used on device 
    errNum |= clSetKernelArg(kernel, 1, sizeof(cl_mem), &maskBuffer); 
    errNum |= clSetKernelArg(kernel, 2, sizeof(cl_mem), &outputSignalBuffer); 
    errNum |= clSetKernelArg(kernel, 3, sizeof(cl_uint), &input_.rows); 
    errNum |= clSetKernelArg(kernel, 4, sizeof(cl_uint), &input_.cols); 
    errNum |= clSetKernelArg(kernel, 5, sizeof(cl_uint), &maskWidth); 

    size_t localWorkSize[2] = { 16, 16 }; // Using 2 dimensional range with size of work group 16 
    size_t globalWorkSize[2] = { input_.rows, // Note: Global work size (input image rows and cols) should be multiple of size of work group. 
            input_.cols }; 

    // Queue the kernel up for execution across the array 
    errNum = clEnqueueNDRangeKernel(// enqueue kernel with enabling host blocking until finishing kernel execution 
     queue, 
     kernel, 
     2, 
     NULL, 
     globalWorkSize, 
     localWorkSize, 
     0, 
     NULL, 
     NULL); 
    checkErr(errNum, "clEnqueueNDRangeKernel"); 

    Mat output_ = cv::Mat(input_.rows, input_.cols, CV_8UC1); 


    errNum = clEnqueueReadBuffer(// reading from ourput parameter of kernel 
     queue, 
     outputSignalBuffer, 
     CL_TRUE, 
     0, 
     input_.rows * input_.cols * input_.elemSize(), 
     output_.data, //initialize OpenCV Mat by output_.data which contains output results of kernel 
     0, 
     NULL, 
     NULL); 
    checkErr(errNum, "clEnqueueReadBuffer"); 

    // cut the extra border spaces which has been added in the first part of the code in order to adjust image size with Work Group Size; 

    cv::imwrite("output.bmp",output_); // saving output in image file

カーネルコード：

__kernel void convolve(
    const __global uchar * const input, 
    __constant uint * const mask, 
    __global uchar * const output, 
    const int inputHeight, 
    const int inputWidth, 
    const int maskWidth) 
{  
    uint sum = 0; 

    const int curr_x = get_global_id(0); // current curr_x (row) 
    const int curr_y = get_global_id(1); // current curr_y (col) 
    int d = maskWidth/2;  

    if(curr_x>d-1 && curr_y>d-1 && curr_x<inputHeight-d && curr_y<inputWidth-d) // checking mask borders not to be out of input matrix 
     for(int i=-d; i<=d; i++) 
      for(int j=-d; j<=d; j++) { 
       int mask_ptr = maskWidth*(i+d)+(j+d); //you can also use mad24(maskWidth, i+d, j+d) which is faster. 
       sum += input[(curr_x+i)*inputWidth+curr_y+j]*mask[mask_ptr];    
      } 

    sum /= (maskWidth*maskWidth); // miangin gereftan 

    sum = clamp(sum, (uint)0, (uint)255);// clamp == min(max(x, minval), maxval) 

    output[curr_x*inputWidth+curr_y] = sum; 

}

出典

2017-07-09 11:48:18

こんにちはSoheil Shababi答えてくれてありがとう、私はOpenCLの、OpenCVのか、OpenCVの-CLプロジェクトでこのプログラムを書くところi'amは混乱いずれかの人がビジュアルスタジオで自分のインテグレーションを持っているため、いくつかの言葉は先導的な機能やいくつかの機能のような他のプロジェクトでは気にならない – user7381415

答えて

関連する問題