私の正規表現は私の文字列に何もしません。Pythonの正規表現は何でも一致します
パイソン
data = 'random\n<article stuff\n</article>random stuff'
datareg = re.sub(r'.*<article(.*)</article>.*', r'<article\1</article>', data, flags=re.MULTILINE)
print datareg
は私が
<article stuff
</article>
Aw、c'mon:[Cthulhu Parsing](http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454)もう一度。 – pillmuncher
@pillmuncher:それは私に間違ったHTMLのように見えるので、HTMLパーサーは非常に簡単に作業できるとは思っていません。 – Blender
@Blender:私はあなたが正しいと思います。しかし、置換は有効なXMLではないようです。私は、壊れたXMLは何のために必要なのでしょうか? – pillmuncher