gpgpu

    2

    2答えて

    PGP公開鍵をスクリプトのキーチェーンにインポートしたいが、その内容をファイルに書きたくない。今私のスクリプトは、このん:私はちょうどgpg --importを呼び出し、文字列として公開鍵をインポートすることができるように curl http://example.com/pgp-public-key -o /tmp/pgp && gpg --import /tmp/gpg は、どのように私はこ

    4

    1答えて

    AMD GPU用にOpenCLプログラムを最適化する必要があります。 GCN ISAアセンブリでコアのOpenCLカーネルの一部を書き直したいのですが、WindowsとLinuxの両方をサポートする必要があります。 私は、Linuxで仕事をすることができるように見えるROCmプラットフォームを見つけましたが、Windowsはサポートしていません。 これを達成するために使用できるツールチェーンはあり

    1

    1答えて

    clGetDeviceInfoを使用してCL_DEVICE_ADDRESS_BITSを取得するにはどうすればよいですか? https://www.khronos.org/registry/cl/sdk/1.0/docs/man/xhtml/clGetDeviceInfo.html

    0

    1答えて

    OpenCLの場合、具体的には ローカルフロートアレイの最大サイズはどれくらいですか? 私はこのようなカーネル設定: __kernel void mykern(unsigned int N, __global float* input, __global float* output, __local float* sdata) { // ... } を私は(OpenCLの中)であ

    0

    2答えて

    私は、2つの正方行列のクロネッカー積を計算する手書きのメソッドを確認するための次のコードを持っています。最初の部分は実際に私の繰り返しとタイリングの方法がそれぞれ同じ出力をもたらすことを確認しています。aとb import pyopencl as cl import numpy from time import time N = 3 num_iter = 1 a = numpy.ra

    0

    1答えて

    CUDAでカーネルを起動するストリームを指定する必要があります。カーネルは、カーネルコードで定義されたサイズの共有メモリを使用します。 static const int cBlockSize = 256; __global__ fooKernel(void* param) { __shared__ uint32_t words[cBlockSize/16]; // imp

    0

    2答えて

    私は、データのチャンク上でベクトル - 行列乗算を実行し、結果をCPUにコピーしてから、別のチャンクの乗算を開始する必要があるコードに取り組んでいます。私はcublasライブラリ(次のコード)を使ってベクトルから行列への乗算を行います。 clock_t a,b; a = clock(); for(int i=0;i<n;i++) { cublasSgemv(hand

    -3

    1答えて

    異なるCPUスレッドからの異なるCUDAストリームを使用するプログラムを実装しました。メモリコピーは、これらのストリームを使用してcudaMemcpyAsync経由で実装されます。カーネルの起動はこれらのストリームも使用しています。このプログラムは倍精度計算を行っています(そして、これが原因だと思われますが、cuBlasはdoubleの行列の乗算に対してCPU使用率75-85%に達します)。また、

    2

    1答えて

    this answerへのフォローアップの質問として。私は、CPUのforループ実行をMetalのカーネル関数に置き換えて、計算を並列化してパフォーマンスを向上させようとしています。 私の機能は基本的に畳み込みです。私は入力配列の値(データはAVCaptureSessionにあります)のために新しいデータを繰り返し受け取っているので、newBufferWithBytesNoCopy:length:

    2

    1答えて

    私はGeForce GT 610でOpenCLプログラムを実行しています.CUDAがより良い選択肢になることは知っていますが、後でCUDA版のコードを書くかもしれませんが、OpenCLで書いていますAMDのグラフィックスカードで実行することができます。 初期化中に、実行するデバイスを選択します。ここに私のプログラムがこの段階でプリントアウトするものがあります: OpenCL Platform 0: