2010-12-14 4 views
0

フロントエンドでは、ユーザーが自分のウェブサイトのリストを作成できるようにするPHPウェブアプリケーションがあります(最大5件)。1日あたりのPythonスクリーンスクレイピングスクリプトを50回(合計8.3分)実行するベストプラクティス?

バックエンドでは、ユーザが登録する各Webサイトのに対して、Pythonスクリプトが毎日実行され(〜10回の反復を実行します)。ウェブサイトごとの各スクリプトは、すべての反復を実行して終了するまでに約10秒かかります。その後、その結果を含むCSVファイルを作成します。

合計で、最大5人のWebサイト* 10回の反復= 50回の反復で、ユーザーあたり8.3分です。

現在、スクリプトは手動でURLをフィードするときに機能するので、動的にウェブアプリケーションの一部にする方法は不思議です。

  1. ユーザー数と各ユーザーが毎日持っているウェブサイトに応じて、毎日実行するスクリプトをプログラムで追加して削除するにはどうすればよいですか。
  2. 適切なパラメータを渡して、各ユーザーの各Webサイトに対してこのスクリプトを実行するようにスケジュールするにはどうすればよいですか。

私はそれが慣習的なプロセスのために作られていることを私が知っている唯一のものだから、多分cronjobsに精通しています。

答えて

1

PHPアプリケーションはURLをデータベース(MySQL、Sqliteなど)またはテキストファイルに置くことができます。次に、Pythonスクリプトのデータベース/テキストファイルをループします。 Cronを使用してPythonスクリプトを毎日実行します。

資源の多くはクーロンの構文を学ぶためにあります。

http://google.com/search?q=cron+tutorial

0

あなたがスクリプトをユーザーごとに50回を実行する必要を行い、またはユーザーが確認するためにあなたのサービスにログインしている場合にのみ、物事について?

0

データベースを使用してユーザーのWebサイトを格納していると仮定すると、毎日のcronジョブとして実行される1つのスクリプトだけで、処理するサイトの一覧をデータベースに問い合わせることができます。

関連する問題