2016-11-07 8 views
0
<li class="col-md-6 col-sm-6 col-xs-12" 
    data-sort-distance="8.6920742598" 
    data-sort-name="Adobe at Arizona Biltmore Country Club" 
    data-sort-rating="3.9000000000" 
    data-sort-ratings-count="380" 
    data-sort-first-review="2012-09-21 00:44:00" 
    data-sort-last-review="2016-11-02 17:19:59" 
    data-sort-3mi-yoh="-0.327954838709677419354838710" 
> 

soup.find_all()を使用してData-sort-XXX値を取得することはできますか?等号の後に値を引き出すにはregexを実行する必要がありますか?Beatiful Soupを使用して下に引っ張るHTML

- 更新 - 迅速な対応をありがとうございます。私は方法がなければならないことを知っていた。

bs4 documentationから

enter image description here

答えて

1

タグは、任意の数の属性を有することができます。タグ<b class="boldest"> は、値が "boldest"である属性 "class"を持っています。あなたのケースでは、

tag.attrs 
# {u'class': u'boldest'} 

ので:あなたは.attrsとして直接その辞書にアクセスすることができます

tag['class'] 
# u'boldest' 

:あなたは辞書のように、タグを処理することにより タグの属性にアクセスすることができますfind_all()を実行してliタグを取得し、次に.attrsを使用して、辞書内のすべてのdata-sort-xyz属性を取得することができます。

関連する問題