Halide言語で書かれたコードにはパフォーマンスカウンタがありますか?私は、自分のコードでいくつのロード、ストア、およびALU操作が実行されているか知りたいと思います。Halideのパフォーマンスカウンタ?
マルチステージパイプラインのスケジューリングのためのHalideチュートリアルでは、割り当てられたメモリ、ロード、ストア、コールの量をハライドFuncと比較して異なるスケジュールを比較していますが、この情報の収集方法はわかりません。これらの操作のいずれかが発生するたびに、trace_stores、trace_loads、およびtrace_realizationsを使用してコンソールに印刷することが可能な場合があります。しかし、これは大きな選択肢ではありません。なぜなら、プログラムの実行が大幅に遅くなり、コンソール出力の長いリストをロード、ストア、およびALU操作の目的のカウントにコンパイルするための何らかのカウントスクリプトが必要になるからです。