uwenku
タグリスト
gpu-warp
0
熱
1
答えて
cudaのスレッド/ワープローカルロック
私はcudaにクリティカルセクションを実装したいと思います。私はこのテーマに関する多くの質問と回答を読んでいます。答えにはatomicCASとatomicExchがよく使われます。 ワープ内のすべてのスレッドがアトミックなCASの後に同じロックを取得し、デッドロックにつながるため、これはワープレベルでは機能しません。 私はwarp __ballotまたは__any命令を使用することで、cudaに本
cuda
critical-section
gpu-warp
2017-08-16
0
熱
1
答えて
スレッドをCUDAの特定のワープに明示的にマッピングする方法はありますか?
動的解析はCUDAプログラム上で実行されていました。その結果、特定のスレッドが同じワープになるように改善されました。 例えば、1024のudaスレッドと32のワープ・サイズを持つふりをしましょう。動的分析の後、スレッド989,243,819、...、42(32個のスレッド総数)が同じワープ。 はと同じワープでなければならないと判断しました。これは、コード実行時に発散がほとんどないためです(CUDA
cuda
gpu
gpgpu
gpu-warp
warp-scheduler
2017-03-24
最新の質問
1.
SFMLでの適切な衝突(C++)
2.
私のアプリをAIDEにインストールすると、なぜこのエラーがポップアップするのですか?
3.
plt.scatter(X [:50,0]、X [:50,1]、color = 'red'、マーカー= 'o'、ラベル= 'setosa')
4.
Graphvizにネストされたノードシェイプを持つことは可能ですか?
5.
htmlのサイズを縮小する方法を教えてください。
6.
MongooseでシードされたデータがMongoDBに保存されていません
7.
std :: initializer_listをメンバ変数として使用
8.
バウンドバリアントジェネリックはAnyになりますか?
9.
ビジュアルスタジオでdataGridViewセルをカスタマイズする方法
10.
mysqlの注文方法は?