2012-04-05 8 views
2

正規表現でUnicodeを使いたいです。正規表現エンジンdk.brics.automatonでUnicodeを使用できますか?

たとえば、RegExp = "\ u0061"は "a"と一致します。しかし、dk.brics.automatonはこれをサポートしていないようです。一致する "u0061"が判明しました。私もRegExp = "\ u0061"とRegExp = "\\ u0061"を試しました。何も動作しませんでした。

このツールの使用経験があれば、解決策を教えてください。

ありがとうございます!

答えて

1

最後に、私はこの問題を回避する方法を見つけました。

まず、JavaコードでUnicodeを使用できますが、個別に作成する必要があります。例えば。 String str = "\u0061"+"b";String str = "\u0061b";はうまく動作しません。

第2に、 "\u0061b\u0063"を含むtest.txtのようなテキストファイルから文字列を読みたい場合は、それらが混在しているため、Unicodeを対応するシンボルに手動で置き換える必要があります。値が "abc"のString strを取得できます。

0

私はdk.brics.automatonには経験を持っていないが、私はeverthingがFAQJavaDoc for the RegExp Classに言われると思います。

私が理解しているように、あなたはユニコード文字を使うことができますが、それは文字( "a")で表現しなければならず、\u0061の表記では表現できません。

+0

ありがとう、スプラッシュ。このツールの作成者に連絡した後、私はJavaのソリューションに焦点を当てるべきかもしれないことに気付きました。その後、私はRegExp = "b" + "\ u0061"をテストしました。トリックは、 "\ u0061"は "b \ u0061"のように個別に作成する必要があるということです。次に、左の問題は、このツールをテキストファイルから "b" + "\ u0061"と読み替える方法です。 – JackWM

関連する問題