IBM SystemやHPのような単一のLinuxボックスでCPUとキャッシュの使用量をリアルタイムで収集/可視化するアプリケーション用のパフォーマンス監視ツールを探しています一般的な構成の8個のプロセッサー/ 80コアのProLiant アプリケーションはOpenMPを使用している自家製のマルチスレッドC +コードです。
この監視ツールは1日24時間実行しないでください。それは電子メール通知を行うべきではありません。
私のアプリにコマンドを送る直前にこのツールを実行すると、アプリはコマンドを実行します(最大数分かかる場合があります)。私は分析する必要があり、この時間間隔の間:80コアのシングルLinuxボックスでアプリケーション(CPUとキャッシュの使用量)を監視する
- usage of cores - data movement between processors - usage of L1, L2, L3 caches - some other metrics (help me here) which can help to find bottleneck in application performance and resource utilization
私は、Nagios/Zabbixのようなツールは、このタスクのためにあまりにも重いことを推測します。
80コアのコマンドラインツールを「top」や「sar」のように使用すると、便利でプロットが難しい(リアルタイムでは必要ありません)のが良いでしょう。
あなたが探しているのは、システム監視ではなくアプリケーションプロファイリングのドメインに該当します。私はそれがはるかに局所的であると思う。 – MikeyB