私は、既存のxhtmlファイルを解析して、追加の本文コンテンツをそのファイルに追加しようとしています。ファイルの早期終了の例外の取得
まず私はJsoupから身体を読んでいると私はXhtmlFile
Document doc = Jsoup.parse(readFile, "UTF-8");
Elements content = doc.getElementsByTag("body");
try {
Document document=null;
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
// Create the builder and parse the file
document = (Document)factory.newDocumentBuilder().parse(finalFile);
//document.getElementsByTagName("body")append(content.toString());
//document=parserXML(finalFile);
document.getElementsByTag("body").append(content.toString());
} catch (SAXException e) {
System.out.println("SAXException>>>>>>");
e.printStackTrace();
} catch (ParserConfigurationException e) {
System.out.println("in parser configuration Exception block>>>>>>");
e.printStackTrace();
}
に入れしようとしていますが、私は次の例外取得しています:
[Fatal Error] ResultParsedFile.html:1:1: Premature end of file.
org.xml.sax.SAXParseException: Premature end of file.
at com.sun.org.apache.xerces.internal.parsers.DOMParser.parse(Unknown Source)
at com.sun.org.apache.xerces.internal.jaxp.DocumentBuilderImpl.parse(Unknown Source)
at javax.xml.parsers.DocumentBuilder.parse(Unknown Source)
at com.converter.typeconverter.EmailTypeConverter.readHTML(EmailTypeConverter.java:101)
at com.converter.typeconverter.EmailTypeConverter.callTika(EmailTypeConverter.java:64)
at com.converter.master.ApplicationMain.main(ApplicationMain.java:64)
を私は次のコードを使用しています
pleseはは...この問題を解決するには、事前に
おかげで...私を助け
finalFileのようなサウンドはおそらく有効なXMLファイルではありません... –
XHTMLの場合は、プレーンなXMLパーサーで解析できるはずです。 Jsoupは、特にX!HTMLを狙ったものではありません。 – bmargulies
@Jonは、解析するためにDOMやSAXパーサを使用しないことを意味しますが、jsoupから、必要なhtmlファイルの本文を取得しています。xhtml(finalfile).thanksの本文にそのメッセージを挿入するだけです。あなたの時間。この点に関するポインタ。 – ramesh