私はいくつかのウェブサイトをクロールしようとしています。しかし、私のクロールプロセスは非常に長く、私はそれを短縮するために複数のインスタンスを使用する必要があります。私は他の方法を探して、依然として私にとって遅すぎる(約8〜9秒)と要求される不必要なリソースをすべて中止しました。CasperJSと並列クロール
casperjsインスタンスを並列化するか、同時に2つのcasperjsを同時に実行して同時にクロールするのが最も簡単な方法は何ですか?
私はブログの投稿から並列gnuを使用しましたが、プロセスが生きているように見えますが、合計実行時間は1つのインスタンスで同じであるため、並列にクロールしていません。
nodejsサーバーを使用してインスタンスを作成する必要がありますか? 最も簡単で最も実用的な方法は何ですか?
あなたは、サーバーの物理的または人為的な限界を打つかもしれないが。これを確認できますか? –