2017-09-09 8 views
0

bs4を使用してXMLの特定の要素の数値文字列を変更しましたが、保存時にhtmlタグやbodyタグをXMLに入れたくありませんファイルとしてのXML。BeautifulSoup4がXMLをラップするのを防ぐ<html>と<body>タグ

<annotation> 
... more stuff here 
</annotation> 

soup = BeautifulSoup(file_obj.read(), 'lxml')

を経由してロードした後に、私はそれを保存する前に、私のXMLを飾り立てるしたかったが、今はそれだけでスープを変換する方が簡単です

<html> 
<body> 
<annotation> 
... more stuff here 
</annotation> 
</body> 
</html> 

なり - >文字列その後、私が欲しくない要素を投げ捨てる。

私が使用している1つの完全なXMLファイルへのリンク:https://gist.github.com/jtara1/4e583160441976e198aba2c7651aaf70

答えて

2

bs4を使用して、あなたがhtml.parserにあなたのパーサーエンジンを変更することができます:

soup = BeautifulSoup(file_obj.read(), 'html.parser') 
関連する問題