2017-09-26 8 views
1

htmlデータ(箇条書きスタイルのデータ)をjava文字列に変換していますが、文字列に迷惑メールの値(�� - デフォルトのUnicode値が置き換えられます)があります。動いていない。文字列javaの 文字を削除します

どのような提案、文字列からこれらのユニコード文字を削除するには?

あなたが持つすべての非ASCII文字を削除することができます
+0

まず、それらがある本当の文字は、その後、ちょうど 'S = s.replace使うものを探してみてください(「the_charsを」、「」) '。 –

+8

おそらく、エンコードを正しく処理して、文字を削除するのではなく、そのまま保持する方がよいでしょうか? – deceze

+0

私のHTMLデータには弾丸スタイルがあり、これらのスタイルはデフォルトのユニコード値(?)に置き換えられ、javaではstringに変換されます。 – Balu

答えて

1

s.replaceAll("[^\\p{ASCII}]", "") 
関連する問題