2017-02-11 23 views
0

私はこの行を解析するためにbeautifulsoupを使用していますが、それを取得していません。beautifulsoupを使用して、クラス内の複数の属性を持つHTMLタグを解析する方法は?

これは私のコードです:

symbols = bsObj.findAll("span", {"class":{"qb_up", "qb_down", re.compile('* qb_shad')}}) 

これは私がピックアップしようとしているHTMLコードです:

<td align="right" class="ds_weighted_alpha qb_shad" nowrap="nowrap">0.00</td> 
+0

という名前で、あなたは 'td'が必要です' –

答えて

0
> import bs4 
> import re 
> 
> td_page = '<td align="right" class="ds_weighted_alpha qb_shad" 
> nowrap="nowrap">0.00</td>' 
> 
> bsObj = bs4.BeautifulSoup(td_page, "lxml") 
> 
> symbols = bsObj.find("td", class_=re.compile("ds_weighted")) 
> 
> symbols_get = symbols.get("class") 
In [107]: symbols_get 
Out[116]: 
['ds_weighted_alpha', 'qb_shad'] 

属性が区切られて心配しないでください。関連するタグをgetメソッドに渡すだけで、属性に複数の値がある場合は、リストが表示されます。 @宏杰李が提案しているように、タグはspanではなく、

関連する問題