ちょうど治療を試して、基本的なスパイダーを動かそうとしています。私はこれがちょうど私が行方不明だと知っているが、私は考えることができるすべてを試した。Scrapy HtmlXPathSelector
私が手にエラーがある:
line 11, in JustASpider
sites = hxs.select('//title/text()')
NameError: name 'hxs' is not defined
私のコードは、現時点では非常に基本的なものですが、私はまだ私が間違っているつもりだ場所を見つけるように見えることはできません。助けてくれてありがとう!
from scrapy.spider import BaseSpider
from scrapy.selector import HtmlXPathSelector
class JustASpider(BaseSpider):
name = "google.com"
start_urls = ["http://www.google.com/search?hl=en&q=search"]
def parse(self, response):
hxs = HtmlXPathSelector(response)
sites = hxs.select('//title/text()')
for site in sites:
print site.extract()
SPIDER = JustASpider()
あなたはどのようにスパイダーを使いますか? 'scrap crawl 'google.com''? – Leo
あなたのコードに何も問題はありません(もうSPIDERを宣言する必要はありません)。 –
@レオこれは私がそれを実行してきた方法です。 –