0
私は自分のサイト(cronによって実行された)のすべてのページをクロールしてデータを更新しようとしています。約500ページあります。最も効率的なページヒットを生成する最も効率的な方法
私は2つのオプションを試しました。
- PHPシンプルなHTML DOMパーサ
- PHPのget_headers上記のいずれかを使用して
、各ページには、大まかにロードするために1.402秒かかります。合計で約570秒かかります。
これを行うより効率的な方法はありますか?
リクエスト、またはファイルシステムを使用してWebサーバーを操作していますか? – Luke
私はウェブサーバーを経由しています – danyo
可能であれば、ファイルシステムを通してファイルを読み込みますか?それがあなたにどんなスピードの利益をも与えるかどうか見てください。 HTTPリクエストと(おそらくApache)おそらく遅くなっています。 – Luke