2011-12-06 10 views
0

私は120文字まで可能なフォームフィールドを持っていて、i18ncharactersを提供するために、特殊文字、数字、およびアルファを含むすべてのUTF-8ユニコード文字セットも受け入れます。先頭と末尾のスペースを無視する必要がありますUTF-8文字セット

ほとんどの場合、限定されたASCIIセットを使用していたため、UTF-8にはどのようなものが含まれているのかわかりません。

ASCII/UTF-8と完全な文字セットの基本的な違いについては、上記の要件を考慮してください。

ありがとうございます。

+1

読みましたか? http://www.joelonsoftware.com/articles/Unicode.html – Mic

答えて

0

単純に、UTF-8はUS-ASCIIの上位セットです。 ASCIIの任意の文字は、UTF-8で表現でき、同じビット表現を使用できます。 UTF-8は、現在定義されている任意の文字の表現を可能にするUnicodeの1つの表現です。

1

ASCIIには128文字しか含まれておらず、最新バージョンのUnicodeには109文字以上の93文字が含まれています。

http://en.wikipedia.org/wiki/ASCII - ASCII

http://en.wikipedia.org/wiki/Unicodeに関する完全な説明 - Unicodeの

http://unicode.org/charts/についてのwikiの記事 - あなたはこれをUnicodeのチャートのリスト

+0

Thx a lot ...文字セットがとても広大なので、utf-8で必要なもののための正規表現を書く標準的な方法はありますか? – testndtv