2016-11-19 3 views
0

私は掻き取られたイメージをキャッシュする方法を探しています。スクラップキャッシュのみのイメージ

私はHTTPCACHE_ENABLEDを持っており、現在scrapyの拡張子実装しています:FilesystemCacheStorage

をしかし、今では、画像パイプラインに行くだけのものがキャッシュされるべきである掻き取り得るすべてのURLのをキャッシュします。

もう1つの解決方法は、ページをキャッシュするが、最後に掻き取ってから掻き取られた玉が変更され、画像を無視するかどうかをチェックする方法である。

私はHTTPCACHE_IGNORE_SCHEMESを試みたが、私はこのスキームに

答えて

0

を私url_list項目を指示かどうかはわかりませんので、文書内のいくつかの掘削後、私は、デフォルトではDummyPolicyを使用していることを発見し、RFC2616にあることを変更まさに私が探していたものでした。

Scrapy Documentation RFC2616

関連する問題