Possible Duplicate:
using python, Remove HTML tags/formatting from a stringPython:テキスト文字列からHTMLヘッダを削除するには?
私は、HTMLファイルを読み込む:
fi = open("Tree.html", "r")
text = fi.read()
私はテキストからHTMLヘッダを削除する:
text = re.sub("<head>.*?</head>", "", text)
なぜこれが動作しませんか?
あなたはhtmlファイルからヘッダ部分を投稿できますか? –
この返答を読む必要があります:http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454 –