BLASルーチンのスケーリング

m個のエントリを持つベクトル上のn×m個の行列の作用を計算する単純なアプローチは、O（n×m）のようなスケーリングのコードにつながります。BLASルーチンのスケーリング

BLASルーチンを使用することは、このような計算には適していますが、O（n x m）よりも優れていますか？または、彼らは素朴なアプローチよりも速いのですが、同じスケーリングをしていますか？

2016-07-25 thyme

同じスケーリング。最適化されたBLASは通常より高速です。純粋なfor-loopと同じ速度が、正しいコンパイルオプションで正しいコンパイラによって最適化されることがあります。これは、行列 - ベクトル乗算などのBLASレベル2演算の状況です。

2016-07-25 14:12:42 kangshiyin

答えて