私はパーサを通す必要があるXML文字列を与えられました。現在、不正なxml文字のためにその文句を言います。非常に簡単な例:xmlを構文解析に安全にするにはどうしたらいいですか?
<someXml>this & that</someXml>
私は解決策が&
で&
を交換することであることを知っているが、私はXMLを生成しないことだし、そのための値を制御することはできません。 「&」はXMLで特別な意味を持っており、グローバルで「&」の置き換え以来
単純な文字列置換するが、これにに正しい方法ではありません「&アンペア;」意図された特別な意味を失うことになる。完全なXML文書を取得し、 '&'が '& amp;'になるように '修正'する方法はありますか?グローバルに「&」を「& amp」に置き換えても安全ですか? '(両側のスペースに注意してください)?
与えられた文字列はNOT xmlなので、エラーメッセージに興味がある場合を除き、XMLパーサーに渡すポイントはありません。非XMLデータを処理するには、非XMLパーサーが必要です。 –
私の目的は上記のものを有効なXMLに変換して解析することですが、良い点です。 (または、あなたが言うように、それを解析するために非XMLパーサーを使用します)。 –