HTTPロードバランシングは厳密な地理的ルーティングではありません。システムがある領域が過負荷であることを理解すると、次の領域にトラフィックがオーバーフローします。
ロードテストを実行し、バックエンドサービスのバランシング設定(balancingMode、capacityScalar、maxRatePerInstance、maxUtilizationなど)を調整して、システムがイーストサーバーに過負荷をかけていて、トラフィックを中央サーバーに送信することを確認することをおすすめします。
実例として、着信トラフィックの100 RPSが現れ、balancingMode = UTILIZATION maxUtilization = 0.8(デフォルト)を設定したとします。あなたのインスタンスは60%のCPUなので、最大の利用率に達していないので、システムは100RPSのトラフィックをすべて送信しています。
負荷テストを実行して、メモリが不足する前にサーバが80RPSのトラフィックを処理できることを発見し、そのCPUはメモリ集約型アプリケーションの信頼できる指標ではありません。 balancingMode = RATE、maxRatePerinstance = 80に変更します。その後、システムは最大80RPSをイーストサーバーに送信し、20サーバーはセントラルに送信し、両方のサーバーを適切に実行できます。