1
BeautifulSoupは、ドキュメントを解析するときに、簡単にHTMLエンティティを変換できます。BeautifulSoupにHTMLエンティティを出力させる方法
しかし、これを文字列に変換するときにこのステップを逆にする方法があります。そうすれば、解析可能な出力を再び得ることができますか?ここで
は私が得るものです:<p>a<b</p>
BeautifulSoupは、ドキュメントを解析するときに、簡単にHTMLエンティティを変換できます。BeautifulSoupにHTMLエンティティを出力させる方法
しかし、これを文字列に変換するときにこのステップを逆にする方法があります。そうすれば、解析可能な出力を再び得ることができますか?ここで
は私が得るものです:<p>a<b</p>
私は任意のAPIの解決策を見つけることができなかったとして、私は達成するために、この猿パッチを使用します。
ここ>>> import BeautifulSoup
>>> BeautifulSoup.BeautifulSoup("<p>a<b</p>", convertEntities=BeautifulSoup.BeautifulSoup.ALL_ENTITIES)
<p>a<b</p>
は私が取得したいものです希望の結果:
from BeautifulSoup import NavigableString
__nv_str__str__ = NavigableString.__str__
NavigableString.__str__ = lambda self, encoding=None: __nv_str__str__(self, encoding=encoding).replace("<", "<").replace(">", ">")