0
期限切れのドメインデータリストの"https://www.expireddomains.net/deleted-com-domains/"
をスクレイプしようとしています。治療データテーブルの抽出
私は常に次の
class ExpiredSpider(BaseSpider):
name = "expired"
allowed_domains = ["example.com"]
start_urls = ['https://www.expireddomains.net/deleted-com-domains/']
def parse(self, response):
log.msg('parse(%s)' % response.url, level = log.DEBUG)
rows = response.xpath('//table[@class="base1"]/tbody/tr')
for row in rows:
item = DomainItem()
item['domain'] = row.xpath('td[1]/text()').extract()
item['bl'] = row.xpath('td[2]/text()').extract()
yield item
のための空の項目フィールドは、誰かが間違っているものを指摘することができますか?ありがとう。