2016-05-20 9 views
3

は、私は、変数に格納tagこのHTMLタグ、内からすべてのテキストを取得しようとしている:結果は"Glenn Miller & His Orchestra"をする必要がありますこのタグ内のテキストをすべて取得するにはどうすればよいですか?

<td rowspan="2" style="text-align: center;"><a href="/wiki/Glenn_Miller" title="Glenn Miller">Glenn Miller</a> &amp; His Orchestra</td> 

しかし、print ing tag.find(text=True)は、"Glenn Miller"を返します。

td要素内の残りのテキストはどうすれば入手できますか?

答えて

4

tag.find(text=True)最初の一致するテキストノードを返します。代わりに.get_text()を使用してください。

>>> from bs4 import BeautifulSoup 
>>> data = '<td rowspan="2" style="text-align: center;"><a href="/wiki/Glenn_Miller" title="Glenn Miller">Glenn Miller</a> &amp; His Orchestra</td>' 
>>> soup = BeautifulSoup(data, "html.parser") 
>>> tag = soup.td 
>>> tag.get_text() 
'Glenn Miller & His Orchestra' 
関連する問題