整形されていないXML文書を解析していて、その中に "&"が含まれていて、そのノードに "&"という構文解析が正しくないと解析しています。"£"を含むXMlの解析
<abcnode>£70.00-£90.00</abcnode>
このノードの値を取得しようとすると「70.00-」が返されます。
私はこのxmlを制御できないので、この不正なxmlを解析する必要があります。
私はURLからxmlをロードするのにXmlTextReader reader = new XmlTextReader(url);
を使用しています。
£
をxmlに置き換えて問題を解決できますが、このxmlは非常に大きいため、無効な文字を置き換えるためにファイルをダウンロードしたくない場合があります(パフォーマンス上の理由から)。
XmlTextReader
を使用してこのxmlを解析する方法はありますか?
私は好きではありませんが、「整形式ではないXML文書」はありません。うまく構成されていない場合は、XMLではありません。エンティティ '£'の定義がある場合、その文書は正しい形式のXMLです。そのような定義がない場合、それは整形式ではなくXMLではありません。 –