1

Google Compute EngineとStackdriverでKubernetesを使用しています。 Kubernetesのメトリックは、カスタムメトリックとしてStackdriverに表示されます。私は正常に "ノードCPUの予約"などのいくつかのカスタムメトリックを示すグラフでダッシュボードを設定します。私は、すべてのノードCPUの予約の集計平均を設定して、私のKubernetesクラスタCPU予約合計が高すぎるかどうかを確認することもできます。スクリーンショットを参照してください。Stackdriverカスタムメトリック集約アラート

enter image description here

私の問題は、私は、カスタムメトリックの平均値にアラートを設定するように見えることはできません。私は各ノードでアラートを設定することができますが、それは私が望むものではありません。私は "Group Aggregate Threshold Condition"を設定することもできますが、カスタムメトリックはそれに対応していないようです。カスタムメトリックがドロップダウンリストにどのように表示されていないかに注目してください。

enter image description here

カスタムメトリックの集計のためのアラートを設定する方法はありますか?もしそうでなければ、私のKubernetesクラスタがCPU予約であまりにも高くなっているときに警告することができますか?

答えて

1

現在、カスタムメトリックの集計に関する警告は、Stackdriverでは使用できません。私たちはあなたが直面している問題に対する様々な解決策を検討しています。 場合によっては、基礎となるリソースを監視するのではなく、問題の症状に直接警告することも可能です。たとえば、Xが発生してユーザーに通知され、Xが悪いためにcpuが心配している場合は、cpuに警告するのではなくXの症状を警告することを検討できます。

+0

私の場合、Kubernetesクラスターにノードを追加するときに警告を受けたいと思っています。だから私は、どのくらいのCP​​Uとメモリがポッドによって要求/予約されているかを見たいと思うと思う。 –

+0

私はマルチゾーンとハイアベイラビリティを実行しているので、自動スケーリングは私にとって一種の仕事です。 –

+0

これはオートスケーリングの状況に役立ちますか? https://github.com/kubernetes/autoscaler/blob/master/cluster-autoscaler/FAQ.md#im-running-cluster-with-nodes-in-multiple-zones-for-ha-purposes-is-that-クラスタごとのオートスケーラによるサポート –