2016-05-31 1 views
1

私はデータを掻き出して抽出する必要がある長いURLのストリームを持っています。1つのページをスクラップで掻き集める

はそれがそれらを処理しますので、私はクモにURLを送ることができる方法はあります私はツイスト原子炉を設定していると私はクモ

runner = CrawlerRunner(scrapy_settings) 
d = runner.crawl(spider_cls) 

を作成すると言いますか?

答えて

1

crawl() methodは、追加の引数を取ることができます:

d = runner.crawl(spider_cls, start_urls=["url"]) 
+0

はクモを再利用する方法はありますか?新しいURLを取得したときに再び作成されないようにするには? – AlexV

+0

@AlexVこれは興味深い質問です!必要なすべての詳細を提供する別の質問を作成してください。ありがとうございました! – alecxe

関連する問題