Google App Engineのインスタンス待ち時間

無料のアプリケーションを実行していて、GAEのPythonランタイムを使用して1つの最大アイドルインスタンスを使用しています。 http://code.google.com/appengine/docs/adminconsole/instances.htmlによるとGoogle App Engineのインスタンス待ち時間

、

アプリケーションの待ち時間は、あなたのトラフィックを提供するために必要なインスタンスの数に最も大きな影響を与えます。のリクエストを迅速に処理すると、1つのインスタンスで多数のリクエストを処理できます。

これは、「アプリケーション設定」のスライダを最小のレイテンシに調整することが最適であると考えられます。

しかし、

、http://code.google.com/appengine/docs/adminconsole/performancesettings.html#Setting_the_Minimum_Pending_Latencyによると、それは長い待ち時間が新しいインスタンスをスピンアップから負荷スパイクを防止するために良いです持つように思えます。

基本的に、要求スパイク（高レイテンシ）に対応する能力と所定の期間（低レイテンシ）にわたって処理される要求数との間にトレードオフがありますか？

出典

2012-01-28 ejang

遅延が発生すると、ドキュメントは要求に応答するコードの遅延を意味します。スライダを調整することはそれとは関係ありません。レイテンシは長くなりますがコードが速い場合は、AppEngineが新しいアプリインスタンスを起動する必要があることを意味します。これは、アップロードしたばかりの人や、長時間使用していない人がいて、アイドル状態のインスタンスがシャットダウンされたか、実行中の他のインスタンスがスタックされているためです。 –

「保留中の待ち時間」は、App Engineが別のインスタンスを起動する前にキューに待機する時間を示します。要求が到着したときにすべてのアプリケーションインスタンスがビジー状態になっている場合、その要求はキュー内で次の利用可能なインスタンスによって処理されるまで待機します。最小値を超えている場合、App Engineはリクエストを処理するために新しいインスタンスを起動することに決めます。

新しいインスタンスの起動には時間がかかり、コストがかかるため、最小の待機時間を設定することができます。最小保留待ち時間が長いということは、新しいインスタンスを開始する前にApp Engineが保留中のリクエストをより長く保持（待機させる）し、インスタンスコストを優先してより多くのトラフィックを処理できることを意味します。最小遅延待ち時間が小さいということは、トラフィックが増加するにつれてApp Engineが新しいインスタンスをより頻繁に開始することを意味します。

「待ち時間」という用語は、アプリが要求に応答するのにかかる時間を指します。アプリケーションが要求に迅速に応答できるほど、単一のインスタンスで処理できる要求が増え、通常は要求キューが短くなります。待ち時間は常に短くて済みますが、アプリではすばやく行う必要があります。

出典

2012-01-28 21:40:38

こんにちはダン、あなたの答えは4歳ですが、まだ関連しています。 'との違いは何ですか？ –

両方の値は、自動スケーラが保留中のキューに満たされていない要求を通知したときに新しいインスタンスを開始することを決定したときに参照されます。最低限、「少なくともこの長い間、リクエストがあって初めて新しいインスタンスを開始しようとしないでください」と言います。最大値は「リクエストがこの間待っていたら、新しいインスタンスを開始する」と表示されます。 2つの値の間の揺らぎの部屋や、最大値（デフォルト）の「自動」の値は、スケーラーがいつどのリソースを必要とするかを推測する権限を与えます。リファレンス：https://cloud.google.com/appengine/docs/python/config/appref#min_pending_latency –

Google App Engineのインスタンス待ち時間

答えて

関連する問題