0
私はウェブサイトでテキストエディタを使用しています。 (それはjHtmlArea) autorsの一部は、Word文書からコピー&ペーストのテキストであり、それは次のような厄介なオフィスのタグで終わる:オフィスを削除する
<h2 style="margin: 10pt 0cm 0pt;"><font size="4"><font color="#4f81bd">
<font face="Cambria">Detect if an email is already saved
<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />
<o:p></o:p></font></font></font></h2>
は、私は、ユーザーがC#のコードを使用してフォームを送信したときに、このテキストをきれいにしたいです。私はいくつかのHTML編集が許可されているとして、タグの一部を維持したいだけで、もう少し複雑化(ホワイトリストとしてこれを考える):
なぜ正規表現を使用するのですか? [彼らはそれを行うことができるものではありません。](http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags) – Nightfirecat