ワークアイテムとストリーミングプロセッサ(cudaコア)との関係は何ですか?私は、作業項目の数がコアの数を大幅に超えなければならないと読んでいます。さもなければ、パフォーマンスの改善はありません。しかし、なぜこれはそうですか?私は1つのコアrepsが1つの作業項目を考えたと思った。誰かが私にこれを理解するのを助けることができる? ありがとうOpenclワークアイテムとストリーミングプロセッサ
2
A
答えて
0
理由は主にスケジューリングです - シングルコア/プロセッサ/ユニットでは、通常、複数のスレッドを実行し、それらの間でメモリレイテンシ(SMT)を隠すことができます。だから、一般的には、各コアが複数のスレッドをキューに入れておくことをお勧めします。
ドライバとハードウェアによっては、コアのSIMD /ベクトル機能を利用するために、複数の作業項目を1つのスレッドに結合することができますが、スレッドは通常少なくとも1つの作業項目に対応します。
1
GPUと他のほとんどのハードウェアは、使用可能なメモリのほとんどにアクセスできるよりもはるかに高速に算術演算を行う傾向があります。プロセッサを持つよりもはるかに多くの作業項目を持つことで、スケジューラはメモリ使用量をずらすことができますが、すでにデータを読み込んだ作業項目はALUハードウェアを使用して処理します。
Here is a good page about optimization in opencl.「 2.4。「コストのかかる「グローバルGPUメモリアクセス」の削除」までスクロールし、この概念に入ります。
関連する問題
- 1. ワークグループとワークアイテム実行
- 2. TFSワークアイテムと要件要件
- 3. TFSブランチングとワークアイテムの追跡
- 4. TFSワークアイテムLabelType MaxLength
- 5. ワークアイテムの階層
- 6. TFSワークアイテムのインポート
- 7. テスラK80とOpenCL
- 8. OpenCLライブラリとバインディング
- 9. OpenCVとOpenCLのコンテナタイプ
- 10. OpenCLのバッファオブジェクトとイメージバッファオブジェクト
- 11. OpenCL/OpenGLとosxクラッシュ
- 12. チェックインTFS 2010のワークアイテムをチェックアウト
- 13. VSTSワークアイテム再アクティブ化レポート
- 14. 非ビジュアルスタジオユーザーのワークアイテムへのアクセス
- 15. Mali OpenCL SDKとOpenCVライブラリ内のOpenCLの違い
- 16. PythonとOpenCLの問題
- 17. AMD CPUとIntel CPU openCL
- 18. OpenCLと複数のビデオカード
- 19. OpenCL Comptuing UnitとProcessing Element
- 20. NvidiaとAMDハードウェアのOpenCL FFT?
- 21. OpenCL RK4とGPUの統合
- 22. OpenCL NDrangekernel(3dグローバルサイズと3dローカルサイズ)
- 23. OpenCL - atomic_cmpxchg
- 24. OpenCLカーネルパラメータ
- 25. OpenCLグローバルメモリフェッチ
- 26. OpenClカーネルコード
- 27. OpenCLカーネルタイミング
- 28. OpenCLローカルワークローカルメモリ
- 29. OpenCL、インクルードファイル
- 30. OpenCL get_global_id