gpgpu

    0

    1答えて

    クアルコムによるAdreno GPUについての説明SOC私は両方のメモリが同じであるという質問を思いつきましたか? はいの場合、CUDAのUA(Unified Virtual Addressing)のような仮想アドレッシングがありますか? また、ここでサポートされているCUDA 6の統合メモリモデルのようなものがありますか?

    0

    1答えて

    私のGPUは、コンピューティング機能のバージョンが2.xのNVIDIA GeForce GT440です。 NVIDIAの公式CUDA_C_Programming_Guideは、しかしリミット2. リミット1にOpenGLのコンピュータシェーダのうちの2つをマルチプロセッサ= 1536 あたりの常駐スレッドの最大数をブロック= 1024 あたりのスレッドの最大数を指摘します実装限界1536 = リミ

    4

    1答えて

    でパフォーマンスをカットしますなぜ私がこの記事を読んで: FPGA or GPU? - The evolution continues を誰かが彼が書いているコメントを追加しました: GPUはSIMDなので、 "if-else"ステートメントのコードでは、 のパフォーマンスが半減します。コアの半分が ステートメントのif部分を実行し、残りの半分のコアがアイドル状態のまま残り、 コアの最初の半分がア

    1

    1答えて

    OpenCLベストプラクティスガイド(https://www.cs.cmu.edu/afs/cs/academic/class/15668-s11/www/cuda-doc/OpenCL_Best_Practices_Guide.pdf)は、コマンドが正しい順序で行われるようにするために、3.1.3項に示唆しています。処理は、データ転送の前に発生しません: はqueue0とQUEUE1 ためQUE

    0

    1答えて

    私は大きな数字のために2つの整数配列を掛けることに取り組んでいます。私は基本的に約20桁の数字を掛けましたが、数字が増えると不安定になります。私はテストのためのCPUとカーネルにいくつかのコードを持っており、カーネルはそれぞれの作業の後に私に異なる数字を与えます。問題は、バリアやmutexのようなものかもしれませんが、これほど多くはありません。どのように私はこの不安定を解決することができますか?こ

    0

    2答えて

    私は理論上の帯域幅gtx970を計算しようとしています。与えられたスペックの通り: - それはDDRであるため http://www.geforce.com/hardware/desktop-gpus/geforce-gtx-970/specifications メモリクロックは7GB/S メモリバス幅= 256 帯域幅= 7 * 256 * 2/8の(2 * = 448 GB/s しかし、

    -1

    1答えて

    配列の長さが異なり、各シーケンスが '>'で終わる配列を持っています。 seq = [a、b、f、g、c、d、>、b、g、d、> ....]私は各シーケンスの長さを計算し、seq_length = [6,3,5、...]という別の配列に格納しました。次に、排他スキャンを使用してオフセットを計算し、offset = [0、6、9、..]という配列に格納します。 私が望むのは、各ブロックがオフセット値

    4

    1答えて

    encog-core-javaマスターブランチには、Encog.getInstance().getCL()メソッドがありません。また、OpenCLデバイスへの明示的アクセス(c.f. LeadTune's encog-java example: BenchmarkCL、Encog 2ベース)もありません。 代わりに、我々は魔法のようにCPUと一緒にGPUを検出するConcurrentTrainin

    0

    2答えて

    CUDAの特定のメモリ命令またはコードラインのメモリ帯域幅を測定する方法はありますか? (nvprofはカーネル全体のメモリ帯域幅を出力することができます)。clock()関数が唯一の方法であれば、帯域幅を計算する式は何ですか? ({命令またはコード行ごとの合体アドレスの数}をクロック()の差で割ったもの) 特定の命令またはコード行がメモリ帯域幅を超えているかどうかを確認したいと思います。 (ex

    0

    1答えて

    デバイスのwhileループ内で乱数を生成するOpenCLカーネルを作成しました。受け入れ可能な乱数が得られると、カーネルはループを終了し、その結果をホストに返します。通常、作業項目あたりの反復数は 〜100-1000です。 問題は、whileループを有効にしても結果を返さないときにこのコードがハングすることです。 whileループを無効にした場合、つまり100sではなく1つの乱数しか生成しません。