この質問は、前の質問から、それは違うた、BeautifulSoup4に固有のものです:BeautifulStoneSoup
以来BeautifulSoup 4を自己クローズするタグを尊重するにはどうすればよいですか?
Why is BeautifulSoup modifying my self-closing elements?
selfClosingTags in BeautifulSoup
が(前回のXMLパーサー)なくなって、私が尊敬するbs4
を取得する方法新しい自己閉鎖タグ?たとえば:
import bs4
S = '''<foo> <bar a="3"/> </foo>'''
soup = bs4.BeautifulSoup(S, selfClosingTags=['bar'])
print soup.prettify()
は自己クローズbar
タグをしませんが、ヒントを与えます。 bs4が参照しているこのツリービルダーと、タグを自己クローズする方法は何ですか?
/usr/local/lib/python2.7/dist-packages/bs4/__init__.py:112: UserWarning: BS4 does not respect the selfClosingTags argument to the BeautifulSoup constructor. The tree builder is responsible for understanding self-closing tags.
"BS4 does not respect the selfClosingTags argument to the "
<html>
<body>
<foo>
<bar a="3">
</bar>
</foo>
</body>
</html>
が、上記と同じ警告を出します。私は何か間違っているのですか? – Hooked
問題がなければ、その質問に回答します。コンテンツが空でリストが渡されるべきでないときには、xmlモードのself-closingタグが自動的に作成されるようです。 – Hooked
右。デモを追加しました。 –