私はdocumentbuilderを使用して以下のコンテンツを解析しようとしています。xml javaを解析中の例外
<html>
<head>
<meta charset="utf-8" />
<title>Test</title>
</head>
<body>
<img height="" src="google.gif?<>" />
</body>
</html>
パーザは例外として、srcには<を含めることができません。私はxslを適用しているので、解析する必要があります。 これを行う方法はありますか。今のところ、私は最初にdocumentbuilderを使用して解析し、再度エスケープしてエスケープしています。
データベースから上記のxmlをString形式で取得しています。今私はdocumentbuilderを使用してそれを解析しようとしているときに私は例外を受け取りますsrcは<を含めることはできません。私はStringEscapeUtils.EscapeHTMLを使用してエスケープしようとしましたが、完全なStringをeascapingして、再度documentBuildetを解析できません。 HTmlからのみsrcをパーズする方法を私に教えてください。私はそれを達成できません。 -
これは、XMLエンコーディング[リンク](http://stackoverflow.com/questions/7818928/how-to-encode-symbols-in-xml) – Karthik
XMLパーサのために有用であろうそこにXMLを解析する必要があります。この入力はXMLではありません。あなたはそれを修復しなければならないでしょう。 –