div class="summary"
にウェブコンテンツを抽出したいと思います。 そして、すべてのsummary
divに、私はdiv内のすべてのクラスのデータを抽出したいと思います。治療、h3の内容を抽出する方法は?
以下は私のスニペットです。
questions = Selector(response).xpath('//div[@class="summary"]')
for question in questions:
item = StackItem()
# get the hyperlink of h3 text
item['title'] = question.xpath('a[@h3]/text()').extract()[0]
yield item
私のコードにxpath contenctを書き込むにはどうすればよいですか?
[0]を削除した場合、どの出力を得ますか? –
@ Error404E、空のリスト '[]'。したがって、xpathパラメータには何か問題があります –
私はScrapyを使用したことはありませんでしたが、最初のxpathをこのように置くとどうなりますか? '// div [@ class =" summary "]/h3'? –