flops

    25

    6答えて

    を掛け浮動対追加何、乗算や除算の使用を避け、代わりに加算と減算を使用する数値コードを書くことは価値があるでした。良い例は、多項式を直接計算するのではなく、多項式曲線を評価するのにforward differencesを使用することです。 はまだケースこれは、あるいは現代のコンピュータアーキテクチャは+、より遅い*、/もはやあるポイントに何回も進んでいますか - ? 具体的には、私は大規模なオンボー

    4

    2答えて

    linuxパフォーマンスカウンタサブシステムに対する新しいコマンドラインインターフェイスコマンドである 'perf'を使用して、アプリケーションによって実行される浮動小数点および算術演算の量を測定したいと考えています。 (テスト目的のために、私が作成したシンプルなダミーのアプリケーションを使用します(以下を参照)。 FPと整数演算を測定するために定義された 'perf'イベントが見つからなかったの

    2

    1答えて

    GPU実装では、GLOPSの性能を見積もる必要があります。このコードは非常に基本的ですが、私の問題は、1つ以上の演算子である "sqrt"または "mad"演算に何個のFLOPSを渡すべきかということです。 さらに、このGPUの理論上の最大値は500GFLOPSですが、これらの操作では1 FLOPと言うと、私のコードでは50GFLOPSが得られます。私がそれをプレセントで表現すると、私は10%を得