私はjavaでHTMLファイルを解析/変換するためにHtmlCleanerライブラリを使用しています。HTMLCLEANERはスペイン語の文字を扱います
それはそれはのようなスペイン語の文字を扱うことができていないようだ「ÁáÉéÍíÑñÓóÚúÜü」
私はこのまたは他のソリューションを処理するためのHtmlCleanerで設定できるすべてのプロパティがありますか?ここで私はそれを呼び出すために使用しているコードです。
CleanerProperties props = new CleanerProperties();
props.setRecognizeUnicodeChars(true);
java.io.File file = new java.io.File("C:\\example.html");
TagNode tagNode = new HtmlCleaner(props).clean(file);
UTF-8を使用するようにエンコードを設定する方法はありますか? – Makoto
私はファイルに書き込むときにUTF-8を使用しています。 'new PrettyHtmlSerializer(props).writeToFile(tagNode、filePath、" utf-8 ");' – choop
HTMLファイルは実際にUTF-8としてエンコードされていますか? –