2017-04-25 11 views
0

私は治療のルール/リンク抽出プログラムを試しています。治療中にコールバックが呼び出されない

"restrict_css"の下のCSSは正しいですが、私はscrapyシェルでresponse.cssを使用してリンクを取得できますが、何らかの理由でこれをスパイダーのunerルールとリンク抽出プログラムで実行するとparse_productコールバック関数は呼び出されません。

rules=(
    Rule(LinkExtractor(restrict_css='a.i-next')), 

    Rule(LinkExtractor(restrict_css='div.product-image-wrapper>a'), 
     callback='parse_product'), 
) 

def parse_product(self, response): 

    print("Print anything for testing") 
    return 

ありがとうございました。

+0

あなたはどのページをクロールしていますか? – Granitosaurus

+0

allowed_domains = ['http://www.orsay.com/de-de/'] start_urls = ['http://www.orsay.com/de-de/'] –

答えて

0

あなたのstart_urlsはいずれのルールとも一致しません。最初のルールは次のページ用で、2番目のルールは製品用です。あなたの開始URLは、商品カテゴリー、つまりリンク先ページを指していません。 http://www.orsay.com/de-de/neuheiten/t-shirts/tops.html

または、追加のルールを追加して商品リストのページを見つけることができます。

+0

ありがとうございました。愚かな間違い:) –

+0

@AhmadAshraf偉大な、あなたの問題が解決した場合は、答えの左側に答えを受け入れるをクリックすることを忘れないでください:) – Granitosaurus

関連する問題