私はAVX programming referenceを見ています。 new Haswell instructionsには、待ち望まれている「収集」負荷が含まれています。しかし、インデックスされたデータ項目にどのような整列制限があるのかわかりません。参照のセクション2.5 "メモリアライメント"は、様々なVGATHER*
命令を表2.4または2.5のいずれかに記載すべきであるようですが、そうではありません。新しいHaswell AVXの "ギャザー"命令の配置制限はありますか?
背景:命令のサポートされるデータサイズは4および8バイトですが、私のアプリケーションでは、隣接する16ビットのデータ値のペアをDWORDSに集めることで利益を得ることができます。 2バイトのスケールを持つ奇数のインデックスは、2バイトのアライメントされた4バイトのロードを生成します。マニュアルから、これが失敗するか、そうでなければ意図しない動作をするかどうかはわかりません(むしろ、アラインされていないアクセスをサポートする命令は、その中に「U」を有するように見える)。