のための最適なデバイスを選択します。私が本当に知りたいのは、GPUに搭載されているコア数(計算単位あたりのコア数)です。どのようにこれを正しく行うのですか?私は現在、計算単位と頻度を決定することができます。OpenCLのは、私がCloo、OpenCLのC#のライブラリで働いている、と私は最高の実行時に私のカーネルに使用するデバイスを決定することができますどのように思っていたスループット
EDIT: 私は、すべてのデバイス上で(スピードテストを実行します)プロファイリングし、結果を比較/保存しようと考えています。しかし、私の理解から、これは問題を提起します。なぜなら、あなたは、最適に/公平にすべてのデバイスを比較のために使用するプログラムを書くことができないからです。
これはまた、すべてのカーネル呼び出しに指定するワーカースレッドの最適な数を選択することが有用であろう。どんな助けでも大歓迎です。
あなたがC#を使用して実装する場合は、ここについての良い記事です:http://stackoverflow.com/questions/1542213/how-to-find-the-number-of-cpu-coresは、 -via-net-c –
申し訳ありませんが、私は具体的ではありませんでした.gpuコンピューティングユニットにコア数が必要なので、環境は私を不幸にも助けません。 – guitar80