2
処理が302になるたびに、その処理がキューの最後の項目として追加されます。 Scrapyにリダイレクトを完了させ、その後の次のURLを処理させる方法はありますか?次のURLをクロールする前に、リダイレクト処理を完了します。
処理が302になるたびに、その処理がキューの最後の項目として追加されます。 Scrapyにリダイレクトを完了させ、その後の次のURLを処理させる方法はありますか?次のURLをクロールする前に、リダイレクト処理を完了します。
コメント内にTomášが述べたように、REDIRECT_PRIORITY_ADJUST
はリダイレクト優先度を制御します。
しかし、この設定のデフォルトは+2
なので、デフォルトのスクラップ設定で説明してもいけません。デフォルトでは、すべての治療要求は0
にスケジュールされているので、すべてのリダイレクト要求は他の要求よりも優先される必要があります。
個別のリクエストの優先度は、priority
引数でスケジュールできます。
たとえばあなたが100
に優先順位を設定したい場合、あなたはこの記述します
yield Request("http://someurl.com", priority=100)
を使用すると、[ 'REDIRECT_PRIORITY_ADJUST']を増加しようとすることができます(https://doc.scrapy.org/en/latest/ topics/settings.html#redirect-priority-adjust)valueが役立つかどうかを確認します。 –