タグでエンティティを混在させると、XMLパーサー例外が発生する

JavaとApache Xerces XMLパーサを使用します。エラーはorg.apache.xerces.parsers.DOMParser.parseの内部で発生します。 タグでエンティティを混在させると、XMLパーサー例外が発生する

<content id="xxx">&amp;<br /></content>

このような行は、私が解析したいXML文書内に表示されるパーサがクラッシュし、次のエラーメッセージが返された場合：

org.xml.sax.SAXParseException: The entity name must immediately follow the '&' in the entity reference.

を私がダウンして問題の原因を絞り込むことができ の出現には、私はそれを省略してもうまく動作するが、何が破壊を引き起こすのか理解していない。アンパサンドは正しくエスケープされているため、HTML行の区切り文字として の出現を妨げるものではありません。

< and >もXMLのための特別な文字が。ソースXMLを管理している場合は、CDATAを使用することをお勧めします。 – kosa

私が見たドキュメントでは、HTMLではないので、すべてのタグを終了する必要があります。それはXMLです。このため、人々はXHTMLの規則に従う必要があります。
が終了することが重要だと思います。 – Bry6n

この問題はどのように再現できますか？ ' &
は整形式のXMLです。 – mzjn

このように!CDATAに入れることができます。これは、XMLパーサによって解析されないようにします。あなたはCDATAセクションhereについてもっと読むことができます。

<content id="xxx">&<![CDATA[ ]]/>

2012-02-14 15:05:42 CoolBeans

あなたはCDATAのタグの間のテキストを置く必要があります。

<content id="xxx"><![CDATA[&amp; <br />]]></content>

ORこの方法でそれを書く：

<content id="xxx">&amp; &lt;br /&gt;</content>

2012-02-14 15:11:54

<br/>タグでエンティティを混在させると、XMLパーサー例外が発生する