2017-02-24 21 views
0

私は比較的美しいスープに新しいと言ってこれを前に説明します。私は次の行を理解しています:Beautifulsoupクラス名の後に属性を取得する

soup.find_all('div', class_ = 'favorite_links')[0] 

私はclass = favorite-linksの最初のdivタグの全内容を取得します。

<div class="favorite-links" data-can-favorite="" data-id="10820653"> 
</div> 

私は何を得ることを期待すると、データ-IDの後の数字である。しかし、私が実際にしたいことは、クラス名のすぐ右にあるテキストです。これを行う方法はありますか?私は間違いなく文字列操作を使用してそれを行うことができますが、私はBeautifulSoupを使用して具体的にこれを行う方法があるかどうかを知りたいです。

ご迷惑をおかけして申し訳ございません。私が前に言ったように、私はBeautifulSoupが比較的新しいです。

ありがとうございます!

答えて

1
soup.find_all('div', class_="favorite-links")[0]['data-id'] 
+0

ありがとう、私はすべてのデータIDをHTMLで取得するようにそれをリストの理解に組み込む方法はありますか? – mangodreamz

+0

私の試みがうまくいかない:[tのsoup.find_all(class _ = 'お気に入りリンク')[t] ['data-id']] – mangodreamz

+1

'[a ['data-id'] for a soup.find_all( 'div'、class _ = "favorite-links") ' – eLRuLL

関連する問題