準HTMLテキストは、次のようになります。 Simple<br> text <b>simple</b> text simple <BR><BR>text simple text
、それを解析してdom documentを作成したいと思います。javaの疑似準HTMLテキストの解析方法は?
DocumentBuilder builder = DocumentBuilderFactory.newInstance().newDocumentBuilder();
InputSource source = new InputSource(new StringReader(
Document doc = builder.parse(source);
エラーが発生します:org.xml.sax.SAXParseException; The element type "br" must be terminated by the matching end-tag
私はしたくないが、すべての<br>
<br></br>
、任意の解決策やアドバイスにより置き換える私はこれをしようとすると、しかし、問題は、閉じられていないタグているのですか?
おそらくそれをDOMに取り込むことはできません。 [jSoup](http://jsoup.org/)のような寛大なHTMLパーサを使用する必要があります.HTMLを試して修正します。ウェブブラウザのようなビットです。 –
私はそれがHTMLEditorKitで行うことができると思います... – linski
@BoristheSpider jSoupの必要はありませんが、標準のJavaで行うことができます、私の答えを参照してください。 – linski