私のアプリケーションはまた、パンジャブ語(\ u0A00- \ u0A7F)をサポートするために正規表現 私はマッチャーでパンジャブ別文字を提供しても私は(出力として「なし」になっていたコードUTF-8言語
Pattern classPattern = Pattern.compile("\u0A00-\u0A7F ");
Matcher classMatcher = classPattern.matcher("ਭਾਸ਼ਾ ਸੰਦ");
if (classMatcher.find()) {
System.out.println("yes");
}else{
System.out.println("no");
}
次試してみました)
何らかの理由がありますか?
'[\ u0A00- \ u0A7F]'という文字列を使うのではなく、代わりに '\ p {InGurmukhi}'を使わないのですか?マジックナンバーではなく象徴的です。正規表現で単独で使うことも、囲む文字クラスの一部として使うこともできます。 – tchrist