uwenku
タグリスト
cublas
4
熱
1
答えて
CUDAとcuBLASでの型キャスト
私はcudaでプログラムを書いていますが、データ転送のオーバーヘッドを減らそうとしています。私は行列乗算のためにcuBLASライブラリを使用しています。値が0〜255の30,000,000の数値を送信する必要があります。 私は最終製品をフロートにして1桁に収まると思ってしまうほどコストがかかることを望んでいるので、今はフロートとして送信しています。 cuBLASライブラリやその他の高速数学ライブラ
casting
cuda
cublas
2012-02-05
0
熱
1
答えて
CUBLASは予期せず動作します
CUDA + CUBLASを使用して私の最初のプログラムを書きました。 'cublasDgemm'関数を使用して、2つのN * N行列の積を計算します。 私は自分のプログラムを立ち上げていた頃、同じ誤った答えを得ていました(例えば、5を含む1 * 1行列に要素6を含む1 * 1行列を乗算すると、 30ではなく36である)。 プログラムを何度もチェックしましたが、成功しませんでした。しかし、私がそれ
cuda
cublas
2011-12-24
2
熱
1
答えて
CUBLASは、クエリ
これらが稼働してCUBLASの私の結果ですが、それぞれのGPU(テスラM2050)のための2つのストリームを使用して4つのGPU上でDGEMMパフォーマンスDGEMM:私は私の結果をテストしていると、彼らは大丈夫です 。私は、デフォルトのストリームを使用するバージョンと比較して、私が得ている高いGflops値が心配です。複数のストリームを使用するバージョンについては Gflops = {2.0*1
performance
cuda
blas
cublas
2012-01-03
«
1
2
3
4
5
»
最新の質問
1.
ピクチャを表示画面として使用するためのコード方法
2.
BEMを使用したclassNameとcssモジュールの引数リストの正しい構文
3.
ロード時に自動的にページを最大または特定の%にズームアウトしますか?
4.
Prestashopカートは動作しません
5.
Pygame mouse hold
6.
buildfire.jsでアプリIDを変更する方法
7.
は、CSS
8.
それをサポートしていないブラウザ上の角度サービスワーカー
9.
'WordPress' Permalinksの字形は1つのWebサイトで利用可能ですが、2つ目はありません
10.
モジュールはインストールされますが、インポートできません。