avx

    -1

    1答えて

    SandyBridgeプロセッサ(i7-3820)で一連のアプリケーションをベンチマークしています。 ベンチマークは2つの異なるバージョンで構成されています。 これらの2つのバージョンには同じコードが含まれていますが、最初のバージョンではsse/sse2のイントリンシックが使用され、2つ目のバージョンではavxのイントリンシックが使用されます。私はどちらかのx64またはx86上のSSE instr

    4

    1答えて

    私はいくつかのintel-intrinsincsで書かれたCコードを持っていました。最初にavxでコンパイルした後、ssse3フラグでコンパイルした後、2つの全く異なるアセンブリコードが得られました。例えば: AVX: vpunpckhbw %xmm0, %xmm1, %xmm2 SSSE3: movdqa %xmm0, %xmm2 punpckhbw %xmm1, %xmm2 それはv

    1

    1答えて

    浮動小数点数型/ double4構造体のAVX-256/512コードを探しています。*、+、/、 - 、スカラーなどの基本演算をオーバーロードし、ベクトルからの高速なパフォーマンスを向上させます。 float4/double4を使用して記述されたコード内の操作OpenCLはこれらのデータ型を組み込み関数として持っていますが、XeonPhi上で実行されるC++コードでは、512ビットSIMDユニット

    1

    1答えて

    このコードをNASM 32ビットSSEからNASM 64-AVXに変換したいと思います。それを簡単に行う方法を見つけることは可能でしょうか? 64ビットコードに変換するには、32ビットコードを完全に書き直そうとします。しかし、これは非常に難しい作業であると私は思っています。私はすべてを行うほとんど自動の方法があると思います。 あなたはこのようなプロセスを認識していますか?たとえば、レジ​​スタの名

    0

    1答えて

    二重のHave different optimizations (plain, SSE, AVX) in the same executable with C/C++ "自動重複"は、間違った提案された重複を選んだと私はそれを修正するためのインターフェイスを持っていないようです。 彼らの不在下での利用可能場合を使用する命令セット拡張をオプションするアプリケーション、そして依然として機能を(もっとゆ

    1

    1答えて

    でのx86をコンパイルしようとすると、私はコマンドで、次のアセンブリコードをコンパイルしようとしています: nasm -f elf AvxScalarFloatingPointArithmetic_.asm アセンブリコードを: .model flat,c .const AbsMask qword 7fffffffffffffffh, 7fffffffffffffffh

    2

    1答えて

    どのようにして__m256値のすべてのビットに1の値を設定できますか? AVXまたはAVX2組み込み関数を使用していますか? すべてゼロを取得するには、_mm256_setzero_si256()を使用することができます。 すべてのものを得るために、私は現在_mm256_set1_epi64x(-1)を使用していますが、私はこれがすべてゼロの場合よりも遅くなると思われます。ここにメモリアクセスまた

    7

    1答えて

    ここで共有したいと思われるAVX2関数のIntel Intrinsicsには本当に奇妙なバグがあります。どちらかと言えば、私は何か間違ったことをしています(私はこの時点で実際に何が見えないのですか)、またはライブラリのバグです。私はで時間デバッグされている ymm.m256i_i64[0] = 0xffff'ffff'ffff'ffff ymm.m256i_i64[1] = 0x0000'000