xpathを使ってHTMLページから情報の一部を抽出するにはいくつかの助けが必要です!私は、レビューの評価 exempleを抽出したい:これは私が「5のうち、4.9」表示をしたい、このコードからHTML
コードPythonのscrapでXpathを使って情報を抽出する方法
<div id="BVRRRatingOverall_Rating_Summary_1" class="BVRRRating BVRRRatingNormal BVRRRatingOverall">
<div class="BVRRLabel BVRRRatingNormalLabel">Overall rating </div>
<div class="BVRRRatingNormalImage"><img src="/4_9/5/rating.gif" class="BVImgOrSprite" alt="4.9 out of 5" title="4.9 out of 5" width="85" height="16"></div>
<span itemprop="aggregateRating" itemscope="" itemtype="http://schema.org/AggregateRating" class="BVRRRatingNormalOutOf">
<span itemprop="ratingValue" class="BVRRNumber BVRRRatingNumber">4.9</span>
<span class="BVRRSeparatorText">out of </span>
<span itemprop="bestRating" class="BVRRNumber BVRRRatingRangeNumber">5</span>
<meta itemprop="reviewCount" content="23">
</span>
</div>
であるか、「4.9」が含まれている3つの変数、「外」、「5」
私はこれを使用するが、それはうまくいきませんでした:
response.xpath('//div[@class="BVRRRatingNormalImage"]/img/@alt').extract()
任意のヘルプ?
のdivは、クラス「BVRRRatingNormalImage」を持っていない文字列として一つだけの要素を与える
リスト形式で3つの要素を提供します。 – betseyb
申し訳ありませんbetseyb!私はちょうど下のHTMLコードを入れました! –
このhtmlの例では、このxpath式は '// img [@ class =" BVImgOrSprite "]/@ alt'で動作するはずです。 サイトリンクやコードの例がないと、それがうまくいくかどうかわかりません。 – vold