NVIDIA Fermiアーキテクチャのパフォーマンスカウンタの名前(cudaのdocフォルダにあるCompute_profiler.txt)を見ると、L2キャッシュミスには2つのパフォーマンスカウンタl2_subp0_read_sector_misses l2_subp1_read_sector_misses。彼らはL2の2つのスライスのためだと彼らは言った。NVIDIAのL2キャッシュFermi
なぜL2のスライスが2つありますか?ストリーミングマルチプロセッサアーキテクチャとの関係はありますか?この部門がパフォーマンスに与える影響は?
おかげ
私は考えが好きです。これが確認されたら私は見ていきます。 – Zk1001