我々の自動スケーリングパラメータは、いくつか他のものが利用可能なときに、自動拡張されたGoogle App Engineインスタンスに大きな遅延が発生するのはなぜですか?次のようにapp.yamlを内
automatic_scaling: min_idle_instances: 3 max_idle_instances: automatic max_pending_latency: 30ms max_concurrent_requests: 20
結果は3つの常駐インスタンスと、典型的に2-6動的インスタンス(トラフィックに依存する)であるが、インスタンス間の負荷分布が非効率的と思われます。下のスクリーンショットでは、大部分のリクエストを含む1つのインスタンスと、大規模な21秒のレイテンシ(最後の1分間)があります。
これは、これらの高い待ち時間を説明するために私たちの設定に何か間違いがなければならないことを示しています。
GCPやApp Engineでこのような問題が発生したことがありますか?
インスタンス間のトラフィックの負荷分散は期待できません。http://stackoverflow.com/questions/37188781/in-google-app-engine-only-one-instance-handling-most-of-requestsを参照してください。 –