2012-04-16 11 views
3
で別のタグの文字列属性

をクリアして、私は次のコードでBeautifulSoupを使用して、いくつかのHTMLドキュメントのタイトルタグを変更しよう:設定タイトルタグの文字列属性はBeautifulSoup

>>> doc = BeautifulSoup(open(filename)) 
>>> root = doc.find('html') # works only with html parser 
>>> hafta = root.find(id="hafta") 
>>> content = hafta.find('div', {'class':'convHtml'}) 
>>> content.find('b').string 
u'BAKANLARA N\u0130\xc7\u0130N KURBAN KES\u0130L\u0130R?' 
>>> doc.title.string = content.find('b').string 
>>> content.find('b').string 
>>> 

奇妙なことに、声明doc.title.string = content.find('b').stringcontent.find('b')内の文字列をクリア。なぜこれが起こるのですか?

+0

'filename'で参照されるHTMLソース文書をどこかに投稿できますか? – cfedermann

答えて

3

これはa bug in Beautiful Soupです。私は次のバージョンでリリースされる修正を約束しました。

+0

まもなく修正されることになっていることを知りました。 – cfedermann

関連する問題