0
大規模な高密度行列に転置を掛けるとき、効率的なcuBlasの使用方法はありますか?具体的には、結果の行列が対称であるため、乗算の数を約2倍に減らすという事実を利用する関数があります。効率的に行列を転置するには、cuBlasを使用します。
大規模な高密度行列に転置を掛けるとき、効率的なcuBlasの使用方法はありますか?具体的には、結果の行列が対称であるため、乗算の数を約2倍に減らすという事実を利用する関数があります。効率的に行列を転置するには、cuBlasを使用します。
標準BLAS API ?syrk
が必要です。
C = alpha * A * A^T + beta * C
cuBlasの場合、API名はcublas<t>syrk
です。詳細については、cuBlasドキュメントを参照してください。
http://docs.nvidia.com/cuda/cublas/index.html#cublas-lt-t-gt-syrk