0
これはスカラーブックのサンプルコードです。 このオブジェクトには、指定された文字列内の任意のhtmlタグを削除するメソッドがあります。 しかし、理由として、HTMLタグだけでなく、文字列の内容全体が削除されます。なぜ分かるの?この単純な正規表現が機能しない理由
object HtmlUtils {
def removeMarkup(input: String) = {
input.replaceAll("""</?\w[^>]*>""","")
input.replaceAll("<.*>","")
}
}
val ahtmlText = "<html><body><h1>Introduction</h1></body></html>"
val anewhtmlText = HtmlUtils.removeMarkup(ahtmlText)
println(anewhtmlText)
println(s"Before removing html tags, the string was $ahtmlText and after rmoving html tags the string became $anewhtmlText")