gpgpu

    6

    2答えて

    いくつかのコードでは、対称実行列(Ax = lamba Bx)で一般化された固有値問題の自動ベクトルと自動値を取得する必要があります。このコードはLACPACKのDSPGVXを使用します。 MAGMA機能を使用してGPUでスピードアップしたかったのです。私たちは、行列の大きさ(N)は、分子内の原子の数に関連し、さらに100から50000まで行くと、この http://icl.cs.utk.edu/

    1

    2答えて

    フラグメントシェーダは2つのアトミックカウンタを使用します。それは最初のものをインクリメントすることもインクリメントすることもできないこともあります。ただし、カウンターを変更する前に、現在の値が常に読み取られます。カウンターが後で変更されると、以前に読み取られた値がカスタムロジックに使用されます。すべてこれは(ほとんど可能性のあるunrollable)ループで発生します。 Envisionのおおよ

    4

    1答えて

    cudaプロファイラマニュアルには、より緩和された合体ポリシーのため、未処理メモリトランザクションの数が常にゼロになると記載されています。しかし、私はまだuncoalescingがあると確信しています。それを計算する方法?その周辺に役立つツールやシミュレータはありますか?それらの中で、どれが最も正確であるように見えるか? おかげデバイス1.0では

    3

    2答えて

    GPU上で実行できる最大同時ワークグループの数をプログラムで決定する標準的な方法があるのだろうかと思っていました。 たとえば、5つの計算ユニット(またはSM)を搭載したNVIDIAカードでは、計算ユニットごとに最大8つのワークグループ(またはブロック)が存在する可能性があるため、同時に実行できるワークグループの最大数は40です。 clGetDeviceInfoで計算ユニットの数を見つけることができ

    3

    2答えて

    CUDAはNvidia GPU専用です。 CUDAがサポートされていることをNvidiaグラフィックスカードの仕様が示している場合、OpenCLもサポートしていると結論できますか?異なるOpenCLのバージョンにサポート/互換性の問題がありますか?すなわち、OpenCL 1.0または1.1?

    1

    1答えて

    私はC++でstringデータ型を使用しているCUDAカーネルを作成しています。ただし、コンパイラは次のエラーをスローしています。 error: calling a host function("std::basic_string<char, std::char_traits<char>, std::allocator<char> >::operator =") from a __device__

    4

    3答えて

    私は、GPU OpenCLカーネルを改良して処理を高速化することを考えています。問題は、統合されていない大量のグローバルメモリがあり、フェッチが実際にパフォーマンスを低下させていることです。だから私はグローバルメモリの多くをローカルにコピーするつもりですが、コピーするものを選ぶ必要があります。 私の質問は、メモリの小さなチャンクの多くのフェッチは、より大きなチャンクのフェッチより多くを傷つけるので

    12

    4答えて

    次のエラーが意味するように、ホスト関数( 'rand')を呼び出すことはカーネルでは許可されていません。 error: calling a host function("rand") from a __device__/__global__ function("xS_v1_cuda") is not allowed

    6

    4答えて

    私はWinFormsを使用して従来のマップビューアアプリケーションを持っています。それはsloooooowです。 (速度は許容されるが、Google Maps、Google Earthが登場し、ユーザーは腐敗してしまった。)もっと速くすればもっと速く作ることができるようになりました: 明白な速度向上何も描画する必要はありません、など)、私のプロファイラは私が実際の窒息ポイントは座標変換であることを

    2

    1答えて

    Clooのopenclライブラリを使ってC#プロジェクトでAMD APP Profilerを使用する方法がわかっていますか?私は.NETアプリケーションでsprofileを実行できますが、正しく実行されても結果は出力されません。 編集:ふむ、それは私がちょうどディスプレイドライバにクラッシュを引き起こして、いくつかの危険なOpenCLのコードを持っていた作業を行います。コマンドラインからsprof