5
私は、次の正規表現を使用して(原点はニュースサイトのコメントである)ヘブライ語のテキストのセクションをキャッチしようとしている:正規表現でヘブライ語をJavaでキャプチャするには?
[\u0590-\u05FF \\p{Graph} \\s]+
それはほとんどのコメントに動作しますが、いくつかのコメントを逃しています。
私はこれをデバッグしようとしたのだが、パターンに一致しないヘブライ語の文字がありますようです。
私は
アイデア...この手紙を抽出し、印刷することが整数値が正しいように思われますが、まだ正規表現はそれをキャッチしていないときは?
あなたは 'Pattern.compile'メソッド内で' Pattern.UNICODE_CASE'を使用していますか? –
いいえ、どうですか? – lribinik
それを試してみてください: 'パターンp = Pattern.compile( "YOUR_REGEX"、Pattern.UNICODE_CASE);ヘブライ語の文字を*' –