以下の単純化の例を見てください:jsoupの特殊文字の変換を防ぐにはどうすればいいですか?
public static void main(String[] args) {
String html = "<html>\n" +
" <head></head>\n" +
" <body>\n" +
" <div> \n" +
" <p> 2 <= X </p> \n" +
" </div>\n" +
" </body>\n" +
"</html>";
Document doc = Jsoup.parse(html);
System.out.println(doc.select("p").outerHtml());
}
これは<p> 2 <= X </p>
出力しますが、私はそれがあったように、選択したHTML部分をプリントアウトすることを期待しています:<p> 2 <= X </p>
。 jsoupに '<'のシンボルを変換しないように指示するにはどうすればよいですか?
あなたの入力が有効なHTMLではありません。 Jsoupはあなたのためにそれをエスケープするのは間違いありません。 –
私は入力を制御できません。 jsoupにhtmlの妥当性を無視し、文書をパーズするように指示する方法はありますか? – RedSea