2012-03-07 12 views
1

BeautifulSoupは、ドキュメントを解析するときに、簡単にHTMLエンティティを変換できます。BeautifulSoupにHTMLエンティティを出力させる方法

しかし、これを文字列に変換するときにこのステップを逆にする方法があります。そうすれば、解析可能な出力を再び得ることができますか?ここで

は私が得るものです:<p>a&lt;b</p>

答えて

0

私は任意のAPIの解決策を見つけることができなかったとして、私は達成するために、この猿パッチを使用します。

ここ
>>> import BeautifulSoup 
>>> BeautifulSoup.BeautifulSoup("<p>a&lt;b</p>", convertEntities=BeautifulSoup.BeautifulSoup.ALL_ENTITIES) 
<p>a<b</p> 

は私が取得したいものです希望の結果:

from BeautifulSoup import NavigableString 
__nv_str__str__ = NavigableString.__str__ 
NavigableString.__str__ = lambda self, encoding=None: __nv_str__str__(self, encoding=encoding).replace("<", "&lt;").replace(">", "&gt;")