BLAS Level 1 APIのほとんどは、Fortran 9x +ベクトル化割り当てと組み込みプロシージャを使用して簡単に直接書くことができます。BLASレベル1の手順は現代のFortranコンパイラにはまだ関係していますか?
あなたはIntel Fortranのように、近代的な最適化コンパイラを使用していると仮定すると、正しいターゲット固有のコンパイラの最適化オプション、代わりに、BLASレベル1の手順を使用してから、任意のパフォーマンス上のメリットがあり、Intel MKLまたは他の高速BLASの実装から言いますか?
これらのメリットが現れたときの典型的なベクターサイズは何ですか?