0
m個のエントリを持つベクトル上のn×m個の行列の作用を計算する単純なアプローチは、O(n×m)のようなスケーリングのコードにつながります。BLASルーチンのスケーリング
BLASルーチンを使用することは、このような計算には適していますが、O(n x m)よりも優れていますか?または、彼らは素朴なアプローチよりも速いのですが、同じスケーリングをしていますか?
m個のエントリを持つベクトル上のn×m個の行列の作用を計算する単純なアプローチは、O(n×m)のようなスケーリングのコードにつながります。BLASルーチンのスケーリング
BLASルーチンを使用することは、このような計算には適していますが、O(n x m)よりも優れていますか?または、彼らは素朴なアプローチよりも速いのですが、同じスケーリングをしていますか?
同じスケーリング。最適化されたBLASは通常より高速です。純粋なfor-loopと同じ速度が、正しいコンパイルオプションで正しいコンパイラによって最適化されることがあります。これは、行列 - ベクトル乗算などのBLASレベル2演算の状況です。