0
私はこのコードを使用して、数百ページを削っています。しかし、ときどきa
のxpathが全く存在しない場合、どうすればこのスクリプトを停止しないで、b
を取得してその特定のページに渡すことができますか?Python Scrapy:Xpathが存在しない場合はスキップする
`a = response.xpath("//div[@class='headerDiv']/a/@title").extract()[0]
b = response.xpath("//div[@class='headerDiv']/text()").extract()[0].strip()
items['title'] = a + " " + b
yield items`
'extract_first(デフォルト= '')'ができますが、追加しようとしていますスペースが存在しない場合は先頭にスペースがあるので、aが存在する場合はaのみに連結するか、bを追加する必要があります。 –
'(a + '' + b).strip()はaが一致を返さない場合にキャッチします。最初の文字だけを取得するように、文字列を返すので、extract_firstのインデックスを作成したくない場合もあります。 –
ありがとうございました! –