3
スクリーンスクレイピング時に固定接続で作業することをお勧めしますか?可能性のあるメリットとデメリットは何ですか?スクリーンスクレイピング時にキープアライブを使用する必要がありますか?
私はPHP/cURLを使用してスクラップしています。
スクリーンスクレイピング時に固定接続で作業することをお勧めしますか?可能性のあるメリットとデメリットは何ですか?スクリーンスクレイピング時にキープアライブを使用する必要がありますか?
私はPHP/cURLを使用してスクラップしています。
それほど大きな違いはありません。あなたが必要とする実際のパフォーマンスの決定は、並行スクレイピングです。永続的であるかどうかにかかわらず、1つの接続は1度に1つの要求/応答しか処理できません。私はこすりするPHP /カールを使用してい
:私の次のポイントに私をもたらし
。
PHPはおそらくこの仕事には間違ったツールです。並行性はあまり良くありません。少なくとも、デフォルトビルドはそうではありません。
'PHPはおそらくこの仕事には間違ったツールです。 ' - >なぜですか?いくつかのことについては、それは完全にうまくいくでしょう。どのようなケースが悪いと思われるのか、その理由を知ることは有益です。 – Nicole
@Renesis私が見たスクリーンスクレイピングのほとんどのケースは、実行時に行う必要はありません。 Webアプリケーション層からのカールアウトによって応答をブロックする必要があるユースケースはごくわずかです。 – Matt
このケースは、ライブデータであるため実行時に実行する必要があります。また、可能であれば、multi_curlを使用して並行スクレイピングを実行しています。その場合は – babonk