0
私はリンクをスカーピングしていますhttp://gaana.com/。私はエディタピックアルバムのリストを取得したいが、私はこのリンクを傷つけることができない私のコードで何が間違っているか分からない。 私のクモコード:スクラップを使用して曲をスクラップする方法
import scrapy
from tutorial.items import GannaItem
class GannaSpider(scrapy.Spider):
name = 'gannaspider'
start_urls = ["http://www.songspk.link/"]
def parse(self, response):
for sel in response.xpath('/html/body'):
item = GannaItem()
item['Albumname'] = sel.xpath('div[4]/div[4]/div[2]/div[1]/div[5]/div/ul/li[1]/div/div[2]/a[1]/span/text()').extract()
item['link'] = sel.xpath('div[4]/div[4]/div[2]/div[1]/div[3]/div/div[2]/div/ul/li[1]/div/div[2]/a/@href').extract()
yield item
そして、私はあなたのコードに問題がいくつかあります
{'Albumname': [], 'link': []}