This link は、cuBLAS-XTルーチンがアウトオブコアオペレーションを提供することを示しています。オペランドデータのサイズは、GPUのオンボードメモリサイズではなくシステムメモリサイズによって制限されます。これは、入力データをCPUメモリに格納し、出力のサイズがGPUのメモリサイズより大きい限り、cuBLAS-XT関数を使用できることを意味します。cuBLAS-XTを大きな入力サイズに使用する
this link「非常に大きな問題が発生した場合、cublasXt APIは計算の一部をホストCPUにオフロードする可能性があります」と「Currenty、ルーチンcublasXtgemm()のみがこの機能をサポートしています誰かが違いを理解するために私を助けている場合。これは、入力サイズは、CPUのメモリサイズよりも大きいことを問題の場合ですか?
私は、これら2つの違いを得ることはありません!私は感謝しています。
http://stackoverflow.com/a/14558198/681865 – talonmies