gpu-programming

0熱

1答えて

配列依存性を持つOpenACCコードを書いています。内部ループの各反復は配列の同じ位置を更新できます。 OpenACCで #pragma omp parallel private(i) { long unsigned int digit_local[d+11]; for(i=0;i<d+11;i++) digit_local[i] = 0;

0熱

2答えて

レジスタ値のOpenCLの使用がプログラムにクラッシュする

熱力学計算のためのOpenCLカーネルの作成が終了し、本当に奇妙なバグが観測されました。私のカーネルは、次のようになります。 __kernel void energy(... float3 dest, int nlocal, ...){ int i = get_global_id(0); float3 ev = {0.0f, 0.0f, 0.0f}; for(...

17熱

1答えて

nvidia-smi揮発性GPU - 利用の説明？

私はnvidia-smi -l 1が1秒ごとにGPUを使用することを知っています（以下同様）。しかし、私はVolatile GPU-Utilが実際に意味するものについての説明を感謝します。これは、総SM以上の使用済みSMの数、または占有率などですか？ +-------------------------------------------------------------------------

4熱

1答えて

Python、theano Runtimeerror：elemwiseのサポートを初期化できませんでした

私はこれらのもので新しいことが起こるように、これは些細なことである場合は申し訳ありません。私はtheubuntu trusty tahrの計算に私のGPUを使うようにtheanoをセットアップしました。私はAMD Radeon HD 7670M gpuを持っています。私はGPUとtheanoの機能を確認するためにテストスクリプトを実行しようとすると、私は次のエラーを取得する： Mapped nam

3熱

1答えて

メタルカーネルの平均値の計算

メタルカーネルのランダムな浮動小数点数を持つバッファの平均値を計算する適切な方法は誰もが知っていますか？ threadsPerGroup = MTLSizeMake(1, 1, inputTexture.arrayLength); numThreadGroups = MTLSizeMake(1, 1, inputTexture.arrayLength/threadsPerGroup.depth)

0熱

1答えて

CUDAワープ実行効率

カーネルごとにwarp_execution_efficiencyを得ることができますが、私のプログラムのwarp_execution_効率をどのように得ることができますか？

2熱

1答えて

OpenCL：GPU上の単一計算デバイスですか？

私はGeForce GT 610でOpenCLプログラムを実行しています.CUDAがより良い選択肢になることは知っていますが、後でCUDA版のコードを書くかもしれませんが、OpenCLで書いていますAMDのグラフィックスカードで実行することができます。初期化中に、実行するデバイスを選択します。ここに私のプログラムがこの段階でプリントアウトするものがあります： OpenCL Platform 0:

0熱

1答えて

は、linuxの下にあるC++ programmのamp.h libを含んでいます

Linuxでプログラムされ、実行されているC++プログラムでamp.hライブラリを使用したいと思います。私は空の.cppファイルにamp.hライブラリを含めようとしましたが、コンソール経由でg ++コンパイラでコンパイルしようとしました。下には、.cppファイルと私はコンパイルに使用するコマンドを見つけることができます。 #include <amp.h> #include <amp_graph

0熱

1答えて

`glDrawArrays`関数を呼び出すたびに、効果的でないオフスクリーンバッファへのGPU描画を避けるには？

GPUを使用してOpenGL ESシェーダ言語で画像処理を行い、結果画像をオフスクリーンレンダリングバッファに出力します。 glDrawArraysと呼ぶたびに、GPUがフレームを更新すると仮定します。しかし、描画する配列が10個以上あるので、パフォーマンス上の問題が発生する可能性があると私は考えています。 glDrawArraysがすべて終了した後に、GPUがフレームバッファを更新しないようにす