2012-03-15 10 views
0
> from BeautifulSoup import BeautifulSoup str = '<p><input></input></p>' 
> BeautifulSoup(str, convertEntities=BeautifulSoup.HTML_ENTITIES) 
> <p><input /></p> 

出力がタグを逃したのはなぜですか?それは<p><input></input></p>を印刷する必要がありますが、それはなぜ<p><input /></p>に変換されますか?BeautifulSoupは、タグが見つからない入力を解析します。

答えて

0

タグ<input />は、<input></input>の有効な省略形です。これはHTMLとXMLに当てはまります。あなたはBeautifulSoupに拡張バージョンを出力するように説得することができるかもしれませんが、なぜあなたがこれを望むのかわかりません。

+0

はい私は、コンテンツを変更するのではなく、解析の観点から行います。 – zsong

+0

を明記してください。 BeautifulSoupに入力を正確に複製させますか? – krlmlr

関連する問題