1

2ノードのcassandraクラスタがあり、そのうちの1つを停止して再起動しました。私たちは、オレンジ色の線とのノードを再起動DSE opscenterは、1つのノードがダウンしたときにクラスタに対する書き込み要求の失敗を示します。

opscenter

:この時間間隔の間に、OpsCenterの中のグラフは、このようなものを示しました。私はなぜこのグラフに休憩があるのだろうかと思います。私はこれを尋ねます。アプリケーションが正常に動作していて、他のノードが再起動されている間、青い線でノードにデータが書き込まれていたからです。

答えて

1

これには2つの理由が考えられます。

  1. OpsCenterは、監視されているクラスタに関する情報の一部を(デフォルトで)保存します。 OpsCenterキースペースのレプリケーション戦略とレプリケーションファクタによっては、問題のタイムスタンプがダウンノードによって管理されているパーティションに存在している可能性があります。
  2. 再起動時に何らかの問題が発生し、情報を監視して保存するエージェントコンポーネントが一時的に中断され、その情報が取得されないことがありました。

1は、青いノードのメトリックが再開しているのに対し、オレンジのノードのメトリックはオレンジのノードがまだダウンしていることを示唆しているようです。 1の場合、データはオレンジのノードに渡され(ヒントされたハンドオフを介して)、そのノードがリブートを完了すると利用可能になります。グラフは更新後の値を表示するはずですが、UIをリフレッシュする必要があります。より多くのノードがこの種の障害を起こす可能性は低くなり、RFが高くなると、それは非常に起こりにくくなります(事実上不可能)。

UIをリフレッシュしてもギャップが解決されない場合は、2が最も発生しやすい原因であり、メトリック記録メカニズムのバグを示す可能性があります。そのように報告する価値があるでしょう。

関連する問題