無料のアプリケーションを実行していて、GAEのPythonランタイムを使用して1つの最大アイドルインスタンスを使用しています。 http://code.google.com/appengine/docs/adminconsole/instances.htmlによるとGoogle App Engineのインスタンス待ち時間
、
アプリケーションの待ち時間は、あなたのトラフィックを提供するために必要な インスタンスの数に最も大きな影響を与えます。 のリクエストを迅速に処理すると、1つのインスタンスで多数のリクエストを処理できます。
これは、「アプリケーション設定」のスライダを最小のレイテンシに調整することが最適であると考えられます。
しかし、
、http://code.google.com/appengine/docs/adminconsole/performancesettings.html#Setting_the_Minimum_Pending_Latencyによると、それは長い待ち時間が新しいインスタンスをスピンアップから負荷スパイクを防止するために良いです持つように思えます。
基本的に、要求スパイク(高レイテンシ)に対応する能力と所定の期間(低レイテンシ)にわたって処理される要求数との間にトレードオフがありますか?
遅延が発生すると、ドキュメントは要求に応答するコードの遅延を意味します。スライダを調整することはそれとは関係ありません。レイテンシは長くなりますがコードが速い場合は、AppEngineが新しいアプリインスタンスを起動する必要があることを意味します。これは、アップロードしたばかりの人や、長時間使用していない人がいて、アイドル状態のインスタンスがシャットダウンされたか、実行中の他のインスタンスがスタックされているためです。 –