私は<pre>
タグを含むHTMLコンテンツを持っています。 <pre>
コンテンツの角かっこはすべてHTMLエンティティを使用してエスケープする必要があります。つまり、<
は<
になり、>
は>
になるはずです。他のタグを含むHTMLの前のタグを見つける必要があります
まずは、問題のあるコンテンツがどのファイルに含まれているかを把握したいだけです。
BAD:誰もが、正規表現を使用してこれを行う方法を考えることができる正規表現はこれと一致してはならない:正規表現は、この
<body>
<h1>My Content</h1>
<pre class="some-class">
<foo>
<bar>Content</bar>
<script>
alert('Hi!');
</script>
</foo>
<br>
</pre>
<p>The middle</p>
<pre class="other-class">
<bar>
<foo>Text</foo>
<script>
alert('Bye!');
</script>
</bar>
<br>
</pre>
<p>The end</p>
</body>
GOODと一致する必要があります。
<body>
<h1>My Content</h1>
<pre class="some-class">
<foo>
<bar>Content</bar>
<script>
alert('Hi!');
</script>
</foo>
<br>
</pre>
<p>The middle</p>
<pre class="other-class">
<bar>
<foo>Text</foo>
<script>
alert('Bye!');
</script>
</bar>
<br>
</pre>
<p>The end</p>
</body>
なぜ人々は、彼らが代わりに正規表現の適切なパーサを使用する必要があります理解したくない?...正規表現の質問の半分は、HTML/XMLをパースについて..です – Jens
@Jens奇数はRegexないHTMLパーサーを使用 – Shafizadeh
@Shafizadeh私は知らない – Jens