私は非自明のGAEアプリケーションを構築しようとしていますが、cronジョブ、タスク、バックエンド、またはすべての組み合わせがベースになる必要があるかどうかはわかりませんGAEがHTTP要求に対して持っている要求のタイムアウト限度に基づいています。アプリケーションのタスク、Cronジョブ、バックエンド
私が行う必要がある明確な手順は以下のとおりです。
1)私は上向きに、私は定期的なスケジュールで、あらゆるユーザーの操作なしからデータを取得する必要が15,000サイトの持っています。サイトの総数は静的ではありませんが、読み込まれる間隔の横にデータストア[Table0]にすべて保存されます。間隔は、毎日のように定期的に30日ごとに変わることがあります。
2)「プル」スケジュール基準に適合するステップ#1の各サイトでは、HTTP GETを介してデータを取得する必要があります(再度、すべてまたは2,3サイトのように) 。サイトから応答が返ったら、結果を解析し、このデータを[Table1]のようにデータストアに保存します。
3)[Table1]のデータストアに最近格納されたデータ(特別なフラグが付いている)の場合、追加の処理を行うためにサードパーティのサイトに追加のHTTPリクエストを発行する必要があります。このサイトからデータを受け取るとすぐに、関連するすべての情報をデータストアの別のテーブル[Table2]に保存します。
4)データが利用可能になり、ステップ3から準備が整うとすぐに、データストア内の元のテーブル[Table1]をすべて更新して更新する必要があります。
私は、GAEのウェブリクエストに記載された応答期限を超過することなく、それぞれの作業を完了できるようにするために、どのコンポーネントを使用する必要があるのかわかりません。 cronジョブとタスクによって開始されたリクエストについては、完了までに10分かかりますが、一般的なユーザー主導のリクエストは30秒間許可されます。
私はGAEのあまりにも卑劣な音ではないと思います。その制約にもかかわらず、それは素晴らしいプラットフォームだと思う - デザイナーがリソース消費をより完全に計画するように強制する。 – tooringtest