文字列からHTMLタグを削除したい。 これは簡単ですが、私は知っている、私はそうしました:RegExpとJavaでいくつかのHTMLタグを削除
public String removerTags(String html)
{
return html.replaceAll("\\<(/?[^\\>]+)\\>", " ").replaceAll("\\s+", " ").trim();
}
を問題は、私はすべてのタグを削除したくないということです..私はタグが
<span style=\"background-color: yellow\"> (text) </ span>
文字列にそのまま滞在したいです..
私は...私がやっているGWTを使用してWebアプリケーションの検索で「ハイライト」の一種としてこれを使用してい
そして、検索が見つかった場合ので、私は、これを実行する必要がありますテいくつかのHTMLタグが含まれているxt(索引付けはLuceneによって行われています)、壊れていますが、safeHTMLBuilderのappendHTMLはStringをマウントできません。
これはかなり良い方法で行うことができますか?
ハグ。
をこれらの質問は、これらの日は非常に頻繁にあります。なぜ私たちは同様の質問をまとめることができませんか? *#SO tip *;) –
それは本当の男です。 – caarlos0
エンティティ参照値も考慮に入れてください。 – Edward