私はちょうどhtmlスクレイピングのためにXPathを使い始めました。だから私は構文とちょっと混乱しています。XPATHを使用して属性値をスクレイプしますか?
<a href="/realestateandhomes-detail/15645-SW-74th-Circle-Dr-Apt-5_Miami_FL_33193_M69309-37779">
<img alt="15645 Sw 74th Circle Dr Apt 5, Miami, FL 33193" title="15645 Sw 74th Circle Dr Apt 5, Miami, FL 33193" class="js-srp-listing-photos" itemprop="image" data-src="https://ap.rdcpix.com/1980533383/49e7a93da461352c04b8e7146a8d2ceel-m0xd-w480_h480_q80.jpg" data-omtag="srp-listMap:result:photo" src="https://ap.rdcpix.com/1980533383/49e7a93da461352c04b8e7146a8d2ceel-m0xd-w480_h480_q80.jpg" />
</a>
HTMLのパスは次のとおりです。:私はsourseコードの次のコードからURLを抽出しようとしています
<body>
<li>
<div>
<a></a>
私はhtmlページを解析するscrapyを使用していますが、これは私のこれまでのコード:
私がコードを実行すると、エラーが16行目、つまりitem [] = site.select()。extract()に返されます。私は文法が正しいかどうかわからない、または欠けているもう一つの根本的な問題がある。
エラーは次のように私のitems.pyコードがある
KeyError: 'RealtorItem does not supprot field: link'
です:
from scrapy.item import Item, Field
class RealtorItem(Item):
link = scrapy.Field()
使用している治療のバージョンは何ですか? –
それはscrapyですv 1.4.0 –