2016-12-12 10 views
2

を再起動 - Kubeletによって再起動され構成kubernetesは<a href="http://kubernetes.io/docs/user-guide/pod-states/#restartpolicy" rel="nofollow noreferrer">docs</a>に従ってポリシー

失敗容器、遅延が 同期周波数0、1Xの倍数である、 指数バックオフ遅延と再起動され、2x、4x、8x ...は5分で終了し、成功した10分後に にリセットされます。

カスタムRestartPolicyを定義する方法はありますか?私はできるだけバックオフ遅延を最小限に抑え、指数関数的な振る舞いを落としたいと思っています。

私の知る限りが見つけることができるよう、あなたもRestartPoilcyを設定し、ましてや新しいものを作ることができない...

答えて

1

それがひどくkubeletの信頼性に影響を与える可能性があるため、バックオフ遅延はチューニングされていません。ノード上でクラッシュするポッドがあるとしたら、kubeletは休憩なしにすべてのポッド/コンテナを継続的に再起動し、多くのリソースを消費します。

なぜ再起動バックオフの遅延を変更したいのですか?

+0

あなたが今説明した動作は、私が達成したいことなのです。私はリソースについて心配する必要がない環境にいるので、必要なリソースを犠牲にして、より速い再起動時間を許すことができます。アプリケーションでの役割が非常に重要なので、できるだけ高速な再起動時間を設定するモジュールをいくつか用意しています。 – user1708860

+0

アプリのコンテナがクラッシュし続ける場合は、他の問題(設定が間違っているなど)があり、再起動しても効果がありません。コンテナがしばらくしてクラッシュした場合、バックオフはすでにリセットされておらず、kubeletはただちに再起動する必要があります。なぜあなたのアプリケーションコンテナが頻繁に失敗すると思いますか?また、リソースを気にしなくても、コンテナのランタイム(例えば、ドッカー)を潜在的に圧倒し、ノード全体の信頼性が低下する可能性があります。あなたがリソースを持っているという事実は、すべてのデーモンがそれらを効果的に利用することを意味するわけではありません。 –

+0

私たちは、レガシーシステムをプライベートクラウドに移行しています。DB内の一部のゴミ箱のデータがループしているため、アプリケーションのシナリオが珍しくありません。しかし、そのゴミ箱のデータはしばらくすると削除され、アプリは安全に再起動できます。私が同じコンテナを再起動した場合、システムによって使用されるリソースが指数関数的に増加するとは思っていません。メモリがかなり安定していると思います。取っていいよ。アプリは非常に重要なので、可能な限り早い再起動時間を達成したいと考えています。指数関数的な再起動時間は私たちを驚かせるものです。 – user1708860

関連する問題

 関連する問題