性能がほんのわずかな機能に大きく依存するプログラムがあり、単一のループまたはコードセグメントの速度を1クロック精度まで測定できるようにしたいので、変更が実際に改善しているかどうかを知ることができますパフォーマンスが向上しているのか、単に「最適化された」コードのプラセボに落ちているのかどうかはわかりませんお気に入りの低レベルプロファイリングツールは何ですか?
ffmpegの"bench.h"は、rdtscを使用してクロック時間を測定し、コンテキストスイッチなどを自動的に補うCマクロのセットです。もちろん、このアプローチには独自の弱点があります。他の低レベルのプロファイリングメソッドは、StackOverflowユーザーが好きですか?