を使用してHTMLタグを削除し、私の文字列です:ここStringTokenizerは
String str = "<pre><font size="5"><strong><u>LVI . The Day of Battle</u></strong></font>
<font
size="4"><strong>";
私はStringTokenizer
を使用して文字列内のすべてのHTMLタグを削除します。しかし、私はこのような状況でStringTokenizerを使用する方法を理解していません。 str.replaceAll("\\<.*?>","")
を使用すると、上の文字列のように、一部のタグが文字列の次の行にあるため、すべてのタグを削除すると効率的ではないためです。しかし、私は<
と>
の間のすべての状況でそれをやりたい。どうしたらいいですか? (私はStringTokenizer
を使ってそれを達成したい)。ありがとう..
A)あなたは 'StringTokenizer'を使用すべきではありません。ドキュメントの状態として、それはレガシークラスです。B)正規表現を使ってHTMLを解析しようとするのは無駄です。 –
@BrianRoach htmlタグJSonを削除するための別のライブラリがありますが、私は他のライブラリを使用することができません。それを実現する他の方法はないようです。 – El3ctr0n1c4
他のライブラリを使用できないのはなぜですか? – DNA