Neon命令を使用してARMアセンブラで書かれたコードのパフォーマンスを向上させようとしています。 (?) http://pulsar.webshaker.net/ccc/sample-706454b3ARM Neonアセンブラ - 奇妙なパイプラインの問題
が、私はライン「n.34-0 1cはN0」で突然NEONユニットは10サイクルを待つ必要があるようです気づい:
テストのために、私は計算は、この計算機を使用します。その理由は何か、それとも電卓のバグですか?
また、ARM/Neonアセンブラのパフォーマンスを向上させる方法についていくつかの一般的な情報が必要です。
対象はARM Cortex-A9です。 コンパイルのために、最新のandroid-ndkをインラインアセンブラで使用します。ありがとうございました。
これらのハザードは、キャッシュヒットした場合に1〜2サイクルしかありません。この場合、それは異なるものです。 –