2016-11-11 4 views
1

マスターノードを変更した後、新しいCoreOSバージョン(DirtyCOWの脆弱性に対するパッチされたカーネルを有するもの)にDC/OS 1.8クラスタ内の2~3のマスターノードを変更した後マスターは動作を停止しました。ダッシュボードには空のデータセンターがありました。フラッピングメトリックは、

我々は2つの新しいマスターノードに古いマスターからの/ var/libに/ DCOSを同期。その後、ダッシュボードが再び作動し始めました。 DC/OSダッシュボードにはまだフラップメトリックが表示されます。 私たちはmesos.leaderと動物園のリーダーを持っています。

クラスタを安定させるにはどうすればよいですか?これは私たちに何が起こっ

+0

DCOSクラスタは公式のzen-3 CloudFormationテンプレートで最初に起動され、新しいマスタは同じLaunchConfiguration、userdata(cloud-config)などを使用します。 –

答えて

1

前回は、私たちは、クラスタを再インストールする必要がありました。私はちょうどディスクサイズを増やすために一度に1つずつマスターノードを停止しました。私たちは今、羽ばたき状態に戻ります。私たちは将来、再インストールがあると思います。私は今それを避けるために答えを探しています。

+0

はい、私たちは最後に新しいクラスタを構築しました。たとえDC/OSクラスタがプライベートエージェント、パブリックエージェント、マスターレベルでオートスケーリングを行っても。マスターのグループは最も壊れやすい部分です。たとえば、3つのグループを短期間で新しいオペレーティングシステムに切り替えることはできません。 –