2017-04-03 22 views
1

このサイトをスクラップしようとしていますが、 'NotSupported:サポートされていないURLスキーム' ':なぜルールが間違っていないのであれば、なぜ起こっているのか、あなたの提案は何か、助けてください。どうもありがとう。NotSupported:サポートされていないURLスキーム '':そのスキームで利用可能なハンドラーがありません。

コードはここにある:

from scrapy.spiders import CrawlSpider, Rule, BaseSpider 
from scrapy.linkextractors import LinkExtractor 
class FellowSearch(CrawlSpider): 
    name ='fellow' 
    allowed_domains = ['emma.cam.ac.uk'] 
    start_urls = [' https://www.emma.cam.ac.uk/'] 

    rules =(Rule(LinkExtractor(allow=(r'\?id=\d+$')),callback='parse_obj', follow=True),) 

    def parse_obj(self, response): 
     print response.url 
+0

「ハッピー」の前にスペースがありますか? –

答えて

1

あなたはstart_urls = ['https://www.emma.cam.ac.uk/']にごstart_urls変更でhttpsの前にスペースを削除する必要があります。

+0

あなたの助けをありがとう – Rana

+0

私の治療ルールをチェックしてください。その治療は31のURLしかありませんが100以上あります – Rana

+0

あなたは新しい質問を開き、抽出するURLを指定する必要があります。私はあなたを助けてくれることを嬉しく思っています。 – vold

関連する問題