URLからHTMLコンテンツを読み込もうとしています。コンソールにコンテンツを印刷したくないときは、ä、ö、üのような「Umlaute」が間違って表示されます。URLからJava InputStreamReaderが "Umlaute"をエンコードしない
URL url = new URL("http://www.lauftreff.de/laeufe/halbmarathon-1-2017.html");
URLConnection conn = url.openConnection();
InputStreamReader input = new InputStreamReader(conn.getInputStream(),StandardCharsets.ISO_8859_1);
BufferedReader bi = new BufferedReader(input);
String inputLine;
while((inputLine = bi.readLine()) != null){
System.out.println(inputLine);
}
htmlのヘッダーには、charsetの情報にISO_8859_1と記載されています。また、UTF-8は動作しません。 誰にもアイデアは何をすべきか?
あなたのコンソールはUTF-8またはISO_8859_1をサポートしていませんか? – Jens
結果が正しく表示されています。ただし、「ä」は「ä」と表されます。 – saka1029