2012-03-03 4 views
5

投稿はthis投稿が許可されたドメインの制限なしに任意のサイトをスクロールクロールすることを確認しました。scrapyすべてのドメインを許可する

allowed_domains = ["*"] 

私はこれを行うにはscrapyフレームワークにハッキングよりも他のいくつかの方法があると思いますlike-

ように許可されているドメイン変数に正規表現を使用したとして、それを行うための任意のより良い方法はあり、。

答えて

11

allowed_domainsをまったく設定しないでください。このscrapyファイル内get_host_regex()関数で

ルック:

https://github.com/scrapy/scrapy/blob/master/scrapy/contrib/spidermiddleware/offsite.py

+0

ありがとうございました。しかし、私はallowed_domainsをすべてに設定したいです、それは可能ですか? – riship89

+7

allowed_domainsを設定しないと、すべてのドメインがデフォルトで許可されます。 –

関連する問題