ウェブサイトからデータを取得しようとしていますが、次のコードを使用すると一致する要素がすべて返されます。私はextract_firstを試しましたが、それは誰も返しませんでした!xpath cantは1つだけのhtmlタグを選択します
# -*- coding: utf-8 -*-
import scrapy
from gumtree.items import GumtreeItem
class FlatSpider(scrapy.Spider):
name = "flat"
allowed_domains = ["gumtree.com"]
start_urls = (
'https://www.gumtree.com/flats-for-sale',
)
def parse(self, response):
item = GumtreeItem()
item['title'] = response.xpath('//*[@class="listing-title"][1]/text()').extract()
return item
xpathセレクタで1つの要素のみを選択するにはどうすればよいですか?唯一の非空の値をフィルタリングし、extract_first()
を使用する - - 最初の要素が実際には空であるため、