gpu-programming

    1

    1答えて

    異なるイメージで特定の反復回数のフィルタモーションを適用したい場合、各イメージは異なるブロックサイズに分割されます。例えば 、画像サイズはMATLABを使用してなど、異なるブロックサイズ8x8にこの画像を分割する方法、1024x870で16x16、64x64か?

    13

    1答えて

    私は、ローカルメモリがレジスタメモリよりも遅い、スレッドごとに2つのタイプであるという発言を発見しました。 共有メモリは高速だと思われますが、スレッドのローカルメモリより高速ですか? 私がやりたいことは、メディアンフィルタのようなものですが、中央値ではなくパーセンタイルを使用しています。したがって、私はリストの塊を取って並べ替え、適切なものを選ぶ必要があります。しかし、共有メモリのリストをソートす

    0

    2答えて

    私はGPUmatを試しましたが、mathworksのニューラルネットワークツールボックスはそれをサポートしていません。それ以外の場合は、自分でnn-toolboxを変更する必要があります。しかし、それは私にとっては難しいことです。私のための任意の提案?

    0

    2答えて

    私はCUDAを使って書いているプログラムに問題があります。私は、デバイスメモリにコピーする必要がある入力配列と出力配列を持っています。問題は、両方のアレイが大きすぎてデバイスメモリに収まらないことです。私が今やっていることは、入力と出力の両方の配列を分割し、カーネルを両方の部分に対して順番に実行することです。 このアプローチが機能するためには、cudaMemcpyFromArrayとcudaMem

    6

    5答えて

    私はGPUプログラミングの世界に新たなんだ、私はウィキペディアやグーグルで読んでみましたが、私はまだいくつかの質問を持っている: 私はいくつかのGPU例をダウンロードし、CUDAのために、いくつかの.cuがありましたファイルといくつかのCPPファイルが含まれていますが、すべてのコードは通常のC/C++コードcudaMemcpyToSymbolのようなちょっと変わったコードです。残りは純粋なCコード

    2

    1答えて

    いくつかの画像処理にGLSLを使用しているので、フルスクリーンクワッドを描画し、フラグメントシェーダで処理しています。フラグメントが特定の優先順位で処理されることが期待できるかどうか疑問に思っていますか? 私はフラグメントが並行して処理されていることを知っています。特定のフラグメントの終了時間を保証することはできません。それはちょうど大きな列ですか?そして、パターンはどのように見えますか?スキャン

    1

    2答えて

    GPUでプログラミングするとき、カーネルの機能をデバッグする良い方法はありますか? 私が使用する方法は、printf(...)を使用しているか、または結果をCPUにコピーしてからそれらを調べることです。 デバッグに時間がかかりすぎます。 あなたのアドバイスをいただきありがとうございます。ありがとうございました。

    0

    1答えて

    私はCUDAを使用してGPUコンピューティングアルゴリズムを開発したいと考えています。私はVisual Studio 2010 Ultimate版を使用しています。すべてのコンピューティングツールとSDKをサンプルと一緒にインストールした後、CUDAプロジェクトを開始するために、プロジェクトタイプ「NVIDIA-> CUDA-> CUDA 4.0ランタイム」を選択します。 ProgramData/

    2

    1答えて

    私はVisual Studio 2010を使用しており、C:\ ProgramData \ NVIDIA Corporation \ NVIDIA 4.0 GPUコンピューティングツールキット\ C \ srcにサンプルをビルドしたいと考えています。 私はインクルードファイルに関して多くの問題を抱えていましたが、Visual Studioを使ってC:\ ProgramData \ NVIDIA C

    0

    1答えて

    私は単純なパーティクルシステムを作成しました。私は計算能力2.1のデバイスを持っています。カーネルを最適化するために私は何を変更できますか? 変数tPosとtVelがレジスタに格納されているとします。 __global__ void particles_kernel(float4 *vbo, float4 *pos, float4 *vel) { int tid = blockIdx.