2
複数のHTMLタグを新しい行に置き換える必要があります。 pタグあなたは、コード例に見るように:Jsoup:タグを新しい行に置き換える=>新しい行が空白で始まる
String html = "<p>Zeile1</p><p>Zeile2</p><p>Zeile3</p><p>Zeile4</p>";
Document doc = Jsoup.parse(html);
doc.select("p").append("\\n");
String sanitized = doc.text().replaceAll("\\\\n", System.getProperty("line.separator");
System.out.println(sanitized);
は、ここで出力です:
Zeile1
Zeile2
Zeile3
Zeile4
あなたが見ることができるように私はライン2-4のスペースを取得します。 彼らはどこから来ていますか?どうすればそれらを取り除くことができますか?
スペースは、すぐにあなたが 'テキスト(コールとして' p'要素の間に追加されます)文書上に表示されます。理由は分かりません。各テキスト要素のコレクションを取得し、それらを連結して、スペースがない場合はスペースを取り除くことができます。 – bdares