avx

    1

    1答えて

    「immintrin.h」に含まれるはずの_mm_pow_psまたは_mm256_pow_psのいずれの組み込み関数も見つからないようです。 Clangはこれらを定義していないか、ヘッダーに含めていませんか?

    1

    1答えて

    私は、AVX2値の特定の条件に基づいてAVX2定数を選択するための分岐のない方法を探しています。 私が今やっている何のために擬似コード: condition = _mm256_cmp_gt(value, limit); result = _mm256_or(_mm256_and(condition, constant_a), _mm256_andnot(condition, c

    5

    1答えて

    次のコードは、アラインメントのないAVX命令(MOVAPDではなくMOVUPD)を生成するのはなぜですか?私はVisual Studio 2015でこれをコンパイルしました。データが本当に整列していることをコンパイラにどのように伝えることができますか? const size_t ALIGN_SIZE = 64; const size_t ARRAY_SIZE = 1024;

    2

    1答えて

    AVXまたはAVX2 ISAでサポートされている文字列命令について調べましたが、SSE4.2のような256ビットの文字列比較命令が見つかりませんでした。それ以外の理由AVX/AVX2 ISAが256ビット文字列命令をサポートしないのはなぜですか? また、AVX2はunsigned shortのmulloを16ビット符号なし整数としてサポートしていないことがわかりましたが、理由はわかりません。 SS

    1

    2答えて

    私は、__m256iデータ型(インテルイントリンシックスのAVX命令で使用される)のデータを新しい__m256iにコピーすることに興味があります。 私はAVXレジスタからのデータをメモリに保存してからメモリからデータを新しいレジスタにロードできることを知っています。しかし、それをメモリに格納してから再びロードする操作を使用せずにレジスタを直接 "複製"できる、より簡単な方法(つまり専用の命令)があ

    1

    1答えて

    AVXでは、_mm256_shuffle_*組み込み関数の即値定数の構築に役立つ特殊なマクロがありますか?例えば、_MM_SHUFFLE(..)のSSE対応部分ですか?私は何も見つけることができません。

    1

    3答えて

    AVX/SSEを使用して浮動小数点数を切り捨て、整数のベクトルを生成する方法はありますか?すべてのフロア固有のメソッドは浮動小数点の最終ベクトルを生成するように見えますが、丸めは整数を生成するので奇数です。

    1

    1答えて

    私が試してみてください。私は出力を得る< bは __m256 a = _mm256_set_ps(1, 1, 1, 1, 1, 1, 1, 1); __m256 b = _mm256_set_ps(0, 0, 0, 0, 0, 0, 0, 0); __m256 c = _mm256_cmp_ps(a, b, _CMP_LT_OQ); : [0, 0, 0, 0, 0, 0, 0, 0]

    6

    1答えて

    今日私の質問はあまり複雑ではないはずですが、理由と解決策を見つけることができません。小さな、再現性の例として、私はGCCフラグ-mfmaをオンにしませんでした gcc -fpic -O2 -c test.c 注ので、#error意志によってこのtest.cファイルをコンパイルしようと思って、次のおもちゃのCコード #define _state_ 0 #if _state_ == 1 in

    1

    1答えて

    256レジスタのすべての32ビット要素を合計したいのですが、イントリンシック命令はありません。だから私はこのようないくつかのことを合計しましたが、このメソッドはコンパイル時に多くのアセンブリ命令を生成します。 私の方法: _mm256_store_ps(&temp4[0], sum0_i); c_result[i][j]= temp4[0]+temp4[1]+temp4[2]+tem