2012-01-10 8 views
-2

標準でないASCIi文字列をチェックする正規表現が必要です。非標準ASCII文字の正規表現

+1

"非標準"とはどういう意味ですか? (そして、その意味では、 "ASCII"の意味です。通常、 "ASCII文字"という言葉は、00から7Fを意味しますが、いくつかのバリエーションがあります) – ruakh

+1

"標準ではない" ASCII文字はありません。 ASCII(コードポイント0x00-0x7F)はかなり標準化されています。コードポイント0x80以上のものはすべてASCIIではありません。 –

+0

質問を解釈する賢明な方法は、非標準(ASCII以外の文字)ではなく非標準(ASCII文字)であると思います。言葉遣いが誤解されることもありますが、これは良い質問だと思います。それは私を助けた。 – MattD

答えて

4

あなたは、C#の文字列内の文字のUnicodeのポイントを指定することができます:"[\u0080-\uFFFF]"は、その「ASCII」コード128+

0

あり、その後に否定^記号を入れて、あなたはセットで標準の文字と考えるもの入れて任意の文字を見つける必要がありますセット。それは非標準と一致します。たとえば、私はそれはあなたが非標準を持って一致した場合、私の非標準のマッチパターンが

[^ A-ZA-z]は

になるので、標準では-Zであると考えています。

1

このシンプルなものはあなたのニーズに合っていますか? [^ \ x20- \ x7E]

+0

標準の空白のいくつかをスキップするには "\ t \ n \ r"を追加する必要がありましたが、これは最高のものです。 – mfras3r

関連する問題