2011-02-06 23 views
2

Java正規表現

私はこのコードを使用:

String line = "[ybi-173]"; 
Pattern cleanPattern = Pattern.compile("%|\\|,|[|]|#|&|@|!|^"); 
Matcher matcher = cleanPattern.matcher(line); 
line = matcher.replaceAll(""); 

をしかし、それは動作しません。

この正規表現では、何が間違っていますか?

+0

'\' –

答えて

3

ソリューションが機能しない理由はいくつかあります。

一致させる文字のいくつかは、^,[]などの特殊な意味を持ちます。これらは\文字でエスケープする必要がありますが、さらに悪いことに、\自体をエスケープして、Javaコンパイラが\を正規表現コンストラクタに渡すようにする必要があります。したがって、ステップ1を要約すると、]文字に一致させる場合、Java文字列は"\\]"のようになります。

さらに、これは、代替演算子|ではなく、文字クラス[]の場合です。 「abcのいずれかの文字と一致させたい場合は、文字クラスは[%\,[]#&@!^]となりますが、Java文字列のエスケープルールと特定の文字の特殊な意味により、正規表現は[%\\\\,\\[\\]#&@!\\^]になります。

+4

人々は '[%\\\\、\\\ [\\\]#&@!\\ ^]'のような凶悪な怪物を我慢するのは信じられないほどです。 **はより良い方法になってくれました!! – tchrist

+0

私は '^'について同じことを考えていましたがそれは文字クラスの始めに特別な意味しか持たず、最後にエスケープする必要はないと思われます。 –

4

一部の文字は、異なる解釈をする特殊文字です。あなたはバックスラッシュでそれらすべてをエスケープするか、いっその文字クラスに入れないことができますいずれか(容易になり、非CCの文字をエスケープする必要が読みやすさ):あなたは、文字グループとして、あなたのパターンを定義したい

Pattern cleanPattern = Pattern.compile("[%\\\\,\\[\\]#&@!^]"); 
+1

の文字だけでなく、すべての特殊文字をエスケープする必要があるかもしれません[] – Ido

+0

のため、charクラスの '['と ']'をエスケープする必要があります – codaddict

+0

@codaddict:ありがとう。 – BoltClock

0

[]で囲み、特殊文字をエスケープします。

String n = "%\\,[]#&@!^".replaceAll("[%\\\\,\\[\\]#&@!^]", "");