2017-11-30 8 views
0

xmlとして作成する前に、制御文字を削除する文字列をフォーマットする必要があります。テキストは英語とフランス語の両方です。例えばd?uneのような言葉では、私は "?"テキストから。私は\ p {Cntrl}、[\ u0000- \ u001f]、/ [^ a-zA-ZÀ-ÿ] /いずれも働かなかった。誰もが解決策を事前に感謝Regex in java in english and french textの制御文字用

+1

本当にこの質問のテキストに疑問符を入力するか、制御文字を直接入力しようとしましたか? – VGR

答えて

0

を示唆してもらえこれは、すべての非ASCII文字を検索し、置き換えます:

String resultString = subjectString.replaceAll("[^\\x00-\\x7F]", ""); 

FailedDevの礼儀 - >Replace non ASCII character from string

+0

提案していただきありがとうございますが、これは "Isolant depolystyr neextrud rig"のようなテキストでは機能しません。私はこのような制御文字を取り除きたいと思います。他に提案はありますか? – JavaLearner

+0

@JavaLearner「制御文字」はどういう意味ですか? –