私はベクトルのすべての要素を追加するためのインライン関数を実装しましたが、非SIMD以外のものより高速ではありません。 宣言:これらは、ベクター内のすべてのint型の値を追加するための私の2つの方法があり #define N 128
#define M N
int __attribute__((aligned(32)))temp8[8];
__m256i vec;
int __attrib
私はAVXバージョンに機能を変換しようとしています。関数自体は、基本的にはfloatを比較し、true/falseを返すのは計算に依存します。ここで 本来の機能である: bool testSingle(float* thisFloat, float* otherFloat)
{
for (unsigned int k = 0; k < COL_COUNT/2; k++)
{
AVX2ベクトルを定数で除算したい。私はthis questionと他の多くのページを訪問しました。何かを助けて助けてくれると思ったのですが、私は理解しませんでした。だから問題は、この部門はボトルネックです。 AVX命令を使用して操作をフロートして行うために、鋳造、 まず:私は、2つの方法を試してみました最初の方法では //outside the bottleneck:
__m256i veci