をキャッシュするには、あなたはCUDAプログラミングで「L1およびL2」キャッシュや「のみL2」キャッシュの両方を使用しての違いを説明してくださいもらえますか?時間の実行ではどうすればよいですか?いつ私はより小さなGPU時間を期待することができますか?私はL1とL2の両方のキャッシュを有効にするか、単にL2を有効にしますか?おかげCUDAプログラミング - L1およびL2は
4
A
答えて
8
は、通常は、有効になって両方のL1およびL2キャッシュを残すでしょう。できるだけメモリアクセスを統合する必要があります。つまり、ワープ内のスレッドは同じ128Bセグメント内のデータにできるだけアクセスする必要があります(このトピックの詳細はCUDA Programming Guideを参照してください)。
一部のプログラムは、このように最適化されることができない、そのメモリアクセスは、例えば、完全にランダムです。そのような場合、L1キャッシュをバイパスすることで、たとえば4バイトなどの128Bライン全体のロードを避けることができます(最低32バイトなのでロードします)。明らかに、効率の向上があります.128から4の有効バイトが32から4に改善されました。
関連する問題
- 1. L1、L2、およびL3キャッシュの命名規則? L1、L2、L3キャッシュの語源は何ですか?
- 2. L1とL2ミス料金
- 3. L1とL2 norms in R
- 4. ARM v7のLinuxカーネル領域からL1およびL2キャッシュのアドレス範囲をフラッシュする方法は?
- 5. CUDAプログラミング - 共有メモリ構成
- 6. OpenCLメモリアーキテクチャとGPUの物理メモリ/キャッシュ(L1/L2 ...)の関係は?
- 7. (読み取り/書き込み)CPUはL1、L2、L3
- 8. LUTなどのL1/L2キャッシュの動作とは何ですか?
- 9. crossentropy()関数にl1またはl2正則化を追加
- 10. PyTorchでのL1/L2正規化の追加?
- 11. L2追い出しのL1キャッシュからのキャッシュ追い出し
- 12. 標準化のコスト関数としてのL1ノルム対l2ノルム
- 13. CUDAアーキテクチャのプログラミング
- 14. Map ReduceプログラミングおよびQAコードのファイルサイズ
- 15. Javaおよびイベント駆動型プログラミング
- 16. ザイリンクスISE 9.2およびプログラミングFPGA
- 17. GPUプログラミング、CUDAまたはOpenCL?
- 18. MatlabとGPU/CUDAプログラミング
- 19. CUDAプログラミングmodify blockIdx.xインデックス
- 20. データは処理前にRAMからキャッシュ(L3、L2、L1)を通過しますか?
- 21. CUDAで1Dレイヤテクスチャを作成および使用する方法
- 22. CUDAプログラミング:レガシーGPUをCUDA 7.5ツールキットで使用するには?
- 23. 2つのリストl1とl2については、すべてのe1∈l1、∃p(e1、e2)に対してチェックするにはどうすればよいでしょう?ここで、e2はl2の要素です。
- 24. C++およびJavaにプログラミング機能がありません
- 25. プログラミング、アプリケーション、およびオペレーティングシステムの時間精度
- 26. Cプログラミング型キャストおよび固定小数点
- 27. Cプログラミングの文字列、ポインタ、および割り当て
- 28. PHP終了、戻り値および適切なプログラミング標準
- 29. CUDAのイプシロン、最小および最大定数の検索方法は?
- 30. NVIDIAのL2キャッシュFermi
ありがとうTom!私はまだ投票できません!しかし、あなたの答えは私にとって非常に便利です:) –