gpu-programming

    0

    1答えて

    配列依存性を持つOpenACCコードを書いています。内部ループの各反復は配列の同じ位置を更新できます。 OpenACCで #pragma omp parallel private(i) { long unsigned int digit_local[d+11]; for(i=0;i<d+11;i++) digit_local[i] = 0;

    0

    2答えて

    熱力学計算のためのOpenCLカーネルの作成が終了し、本当に奇妙なバグが観測されました。 私のカーネルは、次のようになります。 __kernel void energy(... float3 dest, int nlocal, ...){ int i = get_global_id(0); float3 ev = {0.0f, 0.0f, 0.0f}; for(...

    17

    1答えて

    私はnvidia-smi -l 1が1秒ごとにGPUを使用することを知っています(以下同様)。しかし、私はVolatile GPU-Utilが実際に意味するものについての説明を感謝します。これは、総SM以上の使用済みSMの数、または占有率などですか? +-------------------------------------------------------------------------

    4

    1答えて

    私はこれらのもので新しいことが起こるように、これは些細なことである場合は申し訳ありません。私はtheubuntu trusty tahrの計算に私のGPUを使うようにtheanoをセットアップしました。私はAMD Radeon HD 7670M gpuを持っています。私はGPUとtheanoの機能を確認するためにテストスクリプトを実行しようとすると、私は次のエラーを取得する: Mapped nam

    3

    1答えて

    メタルカーネルのランダムな浮動小数点数を持つバッファの平均値を計算する適切な方法は誰もが知っていますか? threadsPerGroup = MTLSizeMake(1, 1, inputTexture.arrayLength); numThreadGroups = MTLSizeMake(1, 1, inputTexture.arrayLength/threadsPerGroup.depth)

    0

    1答えて

    カーネルごとにwarp_execution_efficiencyを得ることができますが、私のプログラムのwarp_execution_効率をどのように得ることができますか?

    2

    1答えて

    私はGeForce GT 610でOpenCLプログラムを実行しています.CUDAがより良い選択肢になることは知っていますが、後でCUDA版のコードを書くかもしれませんが、OpenCLで書いていますAMDのグラフィックスカードで実行することができます。 初期化中に、実行するデバイスを選択します。ここに私のプログラムがこの段階でプリントアウトするものがあります: OpenCL Platform 0:

    0

    1答えて

    Linuxでプログラムされ、実行されているC++プログラムでamp.hライブラリを使用したいと思います。 私は空の.cppファイルにamp.hライブラリを含めようとしましたが、コンソール経由でg ++コンパイラでコンパイルしようとしました。下には、.cppファイルと私はコンパイルに使用するコマンドを見つけることができます。 #include <amp.h> #include <amp_graph

    0

    1答えて

    GPUを使用してOpenGL ESシェーダ言語で画像処理を行い、結果画像をオフスクリーンレンダリングバッファに出力します。 glDrawArraysと呼ぶたびに、GPUがフレームを更新すると仮定します。しかし、描画する配列が10個以上あるので、パフォーマンス上の問題が発生する可能性があると私は考えています。 glDrawArraysがすべて終了した後に、GPUがフレームバッファを更新しないようにす