0
The scrapy documentationは具体的には、Webページを実際に取得せずにスパイダーに応答を渡したい場合は、ダウンローダーミドルウェアを使用する必要があることを述べています。しかし、この機能を実現するためのドキュメントや例は見つかりません。Webページを取得せずにスパイダーに応答を渡すにはどうすればいいですか?
リクエストコールバックにURLだけを渡し、アイテムのfile_urls
フィールドにurl(およびその特定の順列)を入力し、実際のダウンロードを処理するためにFilesPipelineを使用したいと考えています。
ウェブページのダウンロードを避けながら、URLをスパイダーに渡すダウンローダーミドルウェアクラスを作成するにはどうすればよいですか?