のために私は(旧)ワーキングウェブサイトのクローラーを更新中です。私がクロールしているウェブサイトにはより厳しい禁止規則が導入されているようですので、この問題を回避する試みとしてクローラを使用し始めました。カスタマイズCrawlera禁止ルールはScrapy
私は現在抱えている問題は、対象のウェブサイトは、標準のHTMLページに302を行うための非標準的な禁止アプローチを使用していることです。クローラーはこれを禁止として検出せず、すぐにクロールを停止します。 Crawleraが禁止として検出したものをカスタマイズできる方法はありますか、別の方法を検討する必要がありますか?
は、サポートチケットを経由して、これを解決することになったし、彼らは彼らのシステムにそのルールを追加することができました。 – Miek