単一領域スパナは、99.99%の可用性SLAで宣伝されています。米国に拠点を置く構成では、アイオワ州カウンシルブラフスにあるノードごとに正確に3つのレプリカが存在します。地理的に地方の災害が発生した場合など、99.99%(年間1時間〜1時間のダウンタイム)が信じられない理由を明らかにする情報を共有できますか?私は、Googleが徹底的な分析を行ったと仮定します。そうでなければ、SLAを宣伝しませんが、詳細な論文は見つかりません。Google Cloud Spanner単一領域可用性分析
地域で障害が発生した場合、Googleはどのような復旧手順を実行し、どのような復旧時間/予想されるデータ損失を伴うか?
(私は複数地域が利用可能であることを理解していますが、いくつかの価格設定データがありますが、ここではこれについては説明しません)。
お返事ありがとうございます。私はまだもっと知りたいと思っています。単一領域の障害が1時間当たり1時間未満の期待値で発生するはずであることを示すどこかの確率/不具合解析がありますか?ボーナスポイントは、それが何かの場合 - 90%未満の確率で30分以内と期待しています。地域の障害が長期化した場合、Googleが他の場所でインスタンスを復活させると期待できますか?別の関連する質問:バックアップは領域外に保存されていますか?私は、ちょうど別のデータポイントのために推測します:ユーザーが直面しているGoogleアプリケーションは通常単一領域に賭けていますか? – spannerfan123
コンテキストのために、私は大部分の技術者の直感は、主要な地域の停電、深刻な気象事件、爆発、そのようなものの可能性のために、単一の地域に賭けないことであろうと信じています。 1年に1時間しかダウンタイムを経験することができないほど膨大な金額を賭けるのは難しいでしょう。もちろん、予期しない問題が発生した場合にはSLAが部分的に修正されますが、まだ大きなメリットがあります。だから、Googleがこのモデルにどれほど自信を持っているのか、それがどういうものなのか、そして事態がひどく悪い場合にGoogleがどのように反応するのかを深く理解したい。 – spannerfan123