データトラフのテクスチャキャッシュを読み込むようにコードを書き直すのは理にかなっています(フィルタリングやその他のテクスチャユニットのオプションは必要ないと仮定しています)、それとも同じですか?どのようにL1キャッシュといくつかのトラフテクスチャユニットのいくつかのデータをロードする方法については?私はそのような戦略を使うことができるコードを持っていますが、それはまったく意味がありますか?CUDA:FERMIのテクスチャキャッシュはL1キャッシュとは別ですか?
FERMIのテクスチャキャッシュがL1キャッシュハードウェアとは別のハードウェアであることを明確にするために、言い換えれば、自分のコード用に合計L1 +テクスチャキャッシュボリュームを賢く使うことができますか?
まさに私が探していた答え、ありがとう。 –