Google Container EngineクラスタでKubernetesを使用していますが、Stackdriverログに、OutOfMemory例外のためにPodの1つが転倒して自動的に再起動することがわかります。 これらのイベントを監視する標準的な方法はありますか? 私はHeapsterを使用していますが、ポッドのシャットダウンと再起動についてのメトリックは提供されていないようです。
私が構築したサービスで動向データを取得するために、Prometheusを使い始めました。私はPythonクライアントライブラリを使用しようとしていますが、使用方法は不明です。 「はじめに」ドキュメントに基づいて、監視するアプリケーションを指すprometheus.ymlファイルがあり、Pythonクライアントライブラリにはこのコードが例として含まれています。 from prometheus_cli