を追加し、デフォルト-O3 -fma float mul_add(float a, float b, float c) {
return a*b + c;
}
で次のコードcompieldは、次のアセンブリ vfmadd132ss %xmm1, %xmm2, %xmm0
ret
I noticed GCC doing this with -O3 already in GCC
SSE(128bit)コールを使用してブルドーザーのOpteronで256bit FMA機能を使用するコードを修正しようとしています。私はこれらの呼び出しのための組み込み関数を見つけることができないようです。 このフォーラムにいくつかの質問は、(例:How to find the horizontal maximum in a 256-bit AVX vector)これらの組み込み関数を使用してい