5熱
1答えて
AVXスカラー演算は、それがバインドされ、メモリ帯域幅となるように、私は、次の簡単な関数が非常に大きな配列を持つ</p> <pre><code>void mul(double *a, double *b) { for (int i = 0; i<N; i++) a[i] *= b[i]; } </code></pre> <p>をテスト
1熱
2答えて
変換8 16ビットSSE
3熱
__m128ベクトルの任意の要素をブロードキャストします。
sseを使用したドットプロダクション
8熱
4答えて
SSE、AVXには欠けていませんか?
0熱
SSE to Neon(_mm_movelh_ps)
4熱
MSVC++ 2015 - 私のプログラムのSSEコンパイラのバグまたはバグ/未定義の動作?
CUDAタイプと同等の組み込み関数は、組み込み関数の__double2loint、__double2hiintと__hiloint2double