1
htmlデータ(箇条書きスタイルのデータ)をjava文字列に変換していますが、文字列に迷惑メールの値(��
- デフォルトのUnicode値が置き換えられます)があります。動いていない。文字列javaの 文字を削除します
どのような提案、文字列からこれらのユニコード文字を削除するには?
あなたが持つすべての非ASCII文字を削除することができますhtmlデータ(箇条書きスタイルのデータ)をjava文字列に変換していますが、文字列に迷惑メールの値(��
- デフォルトのUnicode値が置き換えられます)があります。動いていない。文字列javaの 文字を削除します
どのような提案、文字列からこれらのユニコード文字を削除するには?
あなたが持つすべての非ASCII文字を削除することができます:
はs.replaceAll("[^\\p{ASCII}]", "")
まず、それらがある本当の文字は、その後、ちょうど 'S = s.replace使うものを探してみてください(「the_charsを」、「」) '。 –
おそらく、エンコードを正しく処理して、文字を削除するのではなく、そのまま保持する方がよいでしょうか? – deceze
私のHTMLデータには弾丸スタイルがあり、これらのスタイルはデフォルトのユニコード値(?)に置き換えられ、javaではstringに変換されます。 – Balu