__m128
に4 ints
をロードするためのgccの組み込み関数と、__m256
(揃えられた/整列していない)に8個のintが入っていますか? unsigned ints
はどうですか?SSEが__m128にSSEをロードする
3
A
答えて
7
インテルのSSEのintrnisicsを使用して、あなたが探しているものは以下のとおりです。
_mm_load_si128()
_mm_loadu_si128()
_mm256_load_si256()
_mm256_loadu_si256()
ドキュメント:
- http://software.intel.com/sites/products/documentation/doclib/stdxe/2013/composerxe/compiler/cpp-mac/GUID-833DE069-7D58-43D8-8B63-7FEF4B84E2DF.htm
- http://software.intel.com/sites/products/documentation/doclib/stdxe/2013/composerxe/compiler/cpp-mac/GUID-0A40CBDD-58FD-4F36-9C6D-F3D2355B5E44.htm
符号付きまたは符号なしの区別はありません。ポインタを__m128i*
または__m256i*
にキャストする必要があります。
これらは、IntelのSSEの組み込み関数であり、GCC、クラン、MSVC、およびICCに動作することに注意してください。
GCCの組み込み関数は、GCCのAFAIKでのみ動作します。
+0
ニース、ありがとう、非常に。私は他のフォローアップの質問があります:http://stackoverflow.com/questions/9437860/sse-ints-vs-floats-practice – Cartesius00
関連する問題
- 1. SSEレジスタをロードする
- 2. SSE:__m128と__m128iを2つの__m128dに変換します。
- 3. ベクトルをSSEレジスタにロードする
- 4. 配列をインデックスするために__m128から整数を抽出するSSE
- 5. SSEをトルネードに混ぜる
- 6. SSE to Neon(_mm_movelh_ps)
- 7. SSEのパフォーマンスEigen
- 8. 128ビットSSEカウンタ?
- 9. SSE strangeness with Functions
- 10. AVX SSEと_mm_load1_ps
- 11. SSE命令:Byte + Short
- 12. SSEインライン・チェック・ゼロ・フラグ
- 13. SSE組み込み -
- 14. SSE整数除算?
- 15. CPUにSSEバグがありますか?
- 16. はどのように私はSSEのちょうど初心者ですSSE
- 17. sseを使用したドットプロダクション
- 18. SSEにフラッシュ出力する問題
- 19. SSE双線形補間
- 20. Netty 4 SSEの更新イベント
- 21. SSE(SIMD拡張)gccの
- 22. SSE行列 - 行列乗算
- 23. Python Flask:ルートvs add_url_rule、SSE
- 24. HTML5/Javascript SSE制限回数
- 25. SSE ints vs. floats実践
- 26. SSE 4メモリロードの最適化
- 27. C - GCC SSEベクトル拡張
- 28. 変換8 16ビットSSE
- 29. SSE(SIMD):スカラーによるベクトルの乗算
- 30. SSE over httpsが動作しない
明確化:インテルの組み込み関数ではなく、GCCの組み込み関数を探していますか? – Mysticial
正確にはわかりませんが、組み込み関数はgcc 4.6+から "すぐに使える"ものです。 – Cartesius00