1

組み込みアーキテクチャーからパフォーマンスを評価しようとしました浮動小数点の倍数を検索して、コア2コアとコアi7アーキテクチャーの単一コアでサイクルで実行できますが、それに迅速に答えます。残念ながら私はISAに精通していないので、それぞれの指示を見てもわかりません。私はそれが何らかの種類のSIMD命令であると仮定します。何か案が?現在のIntelアーキテクチャの単一のコアで、いくつの浮動小数点乗算を実行できますか?

答えて

3

1つのこと:コア2は、ではありません。インテルの最新アーキテクチャです。それはサンディーブリッジだろう。

コア2およびコアi7 Nehalemは、持続可能である1 SSE乗算/サイクル。各SSE命令は、最大4つの単精度または2つの倍精度を処理できます。だからサイクルで2 DPまたは4 SP浮動小数点乗算です。

コアi7サンディーブリッジはサステイブルになることができます1 AVX乗算/サイクル。 AVXはSSEの2倍のサイズです。だからサイクルで4 DPまたは8 SP浮動小数点乗算です。

+0

ありがとうございました。現時点で私がどのように市販されているかを示すだけです... – ysap

+0

現在のAMDプロセッサーは同じ性能を提供すると想定するのは安全でしょうか? – ysap

+0

修正。私は、K10アーキテクチャ以来のすべてのAMDプロセッサは、同じSSEスループットを持っていると思います。 (1 SSE multiply/cycle)新しいブルドーザーアーキテクチャでは、各「ブルドーザーモジュール」間の共有FPUによる複雑さよりも少し複雑です。 – Mysticial