2016-04-26 10 views
0

pythons scrapyを使用してimdbをスクラップしようとしています。しかし私は、以下のようにページからの評価情報を取得することができないのです。pythonでscrapyを使用してイメージ要素からimdbのムービーの評価を抽出する方法

image

私は以下のコード使用しています:

from scrapy.spiders import Spider 
from scrapy.selector import Selector 
from imdb.items import ImdbItem 


class ImdbSpider(Spider): 
    name = "imdb" 
    allowed_domains = ["imdb.com"] 
    start_urls = [ 
     "http://www.imdb.com/title/tt0068646/reviews?ref_=%20best", 

    ] 
def parse(self, response): 
    sel = Selector(response) 
    ratings = sel.xpath('//div[contains(@id,"tn15content")]/div/img') 
    items = [] 

     for rating in ratings: 
     item = ImdbItem() 
     item['rating'] = rating.xpath('/@alt').extract() 
     items.append(item) 

return items 

を、これは非常に基本的である場合、私は申し訳ありません私は非常にPythonとWebスクレイピングに新しいですし、本当にどのように達成するために誰かが親切に私を導くだろうかを把握することはできません?

+0

'rating.xpath( './@ ALT')extract_first()' '.'使用の評価のために、現在のセレクタに入るために。 – eLRuLL

答えて

0

/は、余分な、使用である:

rating.xpath('@alt').extract_first() 
関連する問題