以下の正規表現の結果が異なるのはなぜですか?Perl5Util(Apache ORO)とJava正規表現のRegex shorthand " w"の相違
String regexp = "^[\\w]+$";
String input = "Ã";
System.out.println(Pattern.matches(regex, input)); // false
System.out.println(new Perl5Util().match("/" + regex + "/", input)); //true
どうPerl5Utilは、指定された文字の一致を見つけることが、Javaの正規表現エンジンではありませんでしょうか?
_Guess_ 'Perl5Util'はUnicodeをサポートしている可能性があります。 – Tushar
すばやくお返事ありがとうございます。私はそれについて考えましたが、Perl5Utilが入力データ "©"の一致を見つけられなかったときに混乱しました。それはPerl5Utilから期待されていますか? – param83
©は単語文字ではありません。なぜそれが '\ w'とマッチすると思いますか? –