gpgpu

    6

    1答えて

    私はC++ AMPがDirectX 11をサポートするGPUによって加速されることを理解しています。 しかし、私の質問は、DirectX 11互換GPUのないマシンでコンパイルされたC++ AMPプログラムを実行するとどうなりますか? DirectComputeのソフトウェア実装によってエミュレートされますか? CPU上で実行されますか(おそらくSSEスタイルの命令を使用します)? または、実行に

    1

    2答えて

    AES復号化を行うコードを記述しようとしています。私はコードが動作しているが、私は復号化の後にXOR演算を行うことを必要とするCipher Block Chainingを追加できるようにしたかった。 コードを書くのを簡単にするために、私は2つのカーネルを使ってコードを書きました。 1つのブロックで復号化を行うものと、CBC部分でXORを行うもの。私は、DecryptionとXORの間のイベントによ

    0

    4答えて

    私はヘテロジニアスコンピューティングの可能性を理論的に示しています。 CPUまたはGPUのいずれかでシリアルに実行される単一スレッド(非並列化可能)の有効性を比較する必要があります。 GPU上で1つのスレッドを実行するのは意味がないので、奇妙な質問ですが、開発中のヒューリスティックにガイドライン比を実際に使用できます。 私はそれが簡単にテストできると知っていますが、私はCUDAとOpenCLのどち

    4

    1答えて

    ピクセルバッファオブジェクトを使用してピクセルデータをGPUメモリ内に直接転送することができるはずです。私が理解していないのは、OpenGL ES 2.0でPBOがサポートされているかどうかです。私はインコヒーレントな情報を見つけました。 PBOはOpenGL ES 2.0でサポートされていますか? もしそうでなければ、データ(RGBA32)を直接テクスチャに置くためのOpenGL ES 2.0の

    5

    2答えて

    私は、スタティックオブジェクトとダイナミックな光源(都市モデル)を持つ屋外シーンを照らすために、OpenGLまたはGPGPUに基づいて、適切なグローバルイルミネーション技術を見つけることを試みてきました。それは非常に正確なものである必要はありませんが、それはむしろ単純で、可能であれば反復的で洗練されている必要があります(中間結果を表示することができます)。 私がインターネット上で見つけたベストマッ

    0

    1答えて

    NVIDIAのWebサイトでは、CUDAとスキャン操作を使用して並列にツリーを構築することができます。私はスキャン操作を使って並行してヒープを構築する方法を説明する文書があるかどうか疑問に思っていました。これのためのコードを含むドキュメントも素晴らしいでしょう。私はGPUメモリにいくつかの値を持っていますが、その中からトップk値を返す必要があります。私は並列でヒープを構築し、トップkの結果を返すこ

    1

    1答えて

    プログラミングガイドからの引用: グローバルメモリアクセスはキャッシュされています。 -dlcmコンパイルフラグを使用すると、コンパイル時にL1とL2(-Xptxas -dlcm = ca)(デフォルト設定)またはL2のみにキャッシュされるように構成することができます (-Xptxas -dlcm = cg) 。 l1キャッシュを無効にするために、VS 2008で何を変更する必要があるかを正確に知

    1

    2答えて

    マルチコアがGPUに比べて優れた性能を発揮するアルゴリズムのリストを提案できますか?私はハイブリッドアプローチがまだまだ速いことを知っていますが、私が本当に求めているのは、GPUがまだマルチコアに遅れている分野を理解することです。最も適切に少なくともから、適切な適合性のために

    1

    2答えて

    の配列ビューまたは配列オブジェクトを宣言する方法int myarray[2][3]などの配列を使用してarray_viewオブジェクトを初期化しようとしています。試しましたarray_view<int, 2> a(2,3, myarray);しかし、それは動作しません。私はまた、ベクトルで同じことをすることができるようにしたいと思います。何か案は?

    2

    1答えて

    私たちはGPGPUコースの課題に取り組んでいます。私たちはアルゴリズムを選んでCPUに実装し、OpenCLに変換しています。 私たちが選択したアルゴリズムは、モデルを三角形のセットとして読み込み、それらをボクセルにラスタライズします。ボクセルはポイントデータのVBOとして定義されます。その後、ジオメトリシェーダを使用して、これらの点を三角形のボクセルに変換します。 したがって、私たちのOpenCL