Python/BeautifulSoup - 要素からすべてのタグを削除するには？

BeautifulSoupで見つけた要素からすべてのタグを削除するにはどうすればよいですか？Python/BeautifulSoup - 要素からすべてのタグを削除するには？

2013-04-25 Daniele B

あなたがタグを取り除くが、その内容を維持したいと仮定すると、この質問への受け入れ答えを参照してください。Remove a tag using BeautifulSoup but keep its contentsそれはこのようになります

2013-04-25 04:31:04 Shaun

を行うための方法です！このラインとその

ような単純なあなたは一緒に現在の要素内のすべてのテキスト部分

''.join(htmlelement.find(text=True))

出典

2013-04-25 04:46:12

に参加しているあなたは、BS4中で分解の方法を使用することができます。

soup = bs4.BeautifulSoup('<body><a href="http://example.com/">I linked to <i>example.com</i></a></body>') 

for a in soup.find('a').children: 
    if isinstance(a,bs4.element.Tag): 
     a.decompose() 

print soup 

Out: <html><body><a href="http://example.com/">I linked to </a></body></html>

出典

2013-10-17 22:37:41 danblack

何の答えを持っていない理由私はunwrapメソッドに関する何かを見たことがありますか？または、さらに簡単、bs4に行っget_text方法BeautifulStoneSoupで

http://www.crummy.com/software/BeautifulSoup/bs4/doc/#unwrap http://www.crummy.com/software/BeautifulSoup/bs4/doc/#get-text

出典

2014-04-29 00:40:34 Bobby

が、それはのpython3

from bs4 import BeautifulSoup 

soup = BeautifulSoup(html) 
text = soup.get_text() 
print(text)

出典

2015-01-27 02:47:02 shawnl

それはさ'getText（）'の代わりに 'get_text（）'を使うほうがいいです。 – SparkAndShine

なぜですか？それは事実かもしれませんが、理由を理解することは役に立ちます。 –

+11

getText（）はbs3構文であり、pep8に準拠していません。おそらく廃止予定です。 –

使用get_text()にでも簡単です、それは文書内のすべてのテキストを返すか、下に単一のUnicode文字列としてのタグ。例えば

、次のテキストからすべての異なるスクリプトタグを削除します。

<td><a href="http://www.irit.fr/SC">Signal et Communication</a> 
<br/><a href="http://www.irit.fr/IRT">Ingénierie Réseaux et Télécommunications</a> 
</td>

期待される結果は次のとおりです。ここで

Signal et Communication 
Ingénierie Réseaux et Télécommunications

は、ソースコードである：

#!/usr/bin/env python3 
from bs4 import BeautifulSoup 

text = ''' 
<td><a href="http://www.irit.fr/SC">Signal et Communication</a> 
<br/><a href="http://www.irit.fr/IRT">Ingénierie Réseaux et Télécommunications</a> 
</td> 
''' 
soup = BeautifulSoup(text) 

print(soup.get_text())

出典

2015-07-20 16:37:08 SparkAndShine

Python/BeautifulSoup - 要素からすべてのタグを削除するには？

答えて

関連する問題