2012-01-04 4 views
-1

一部の許可された場所からUTF-8文字セットの完全なリストを取得する必要があります。UTF-8文字セットを取得する場所

私はUnicode.orgを見てみましたが、情報はありませんでした。

+2

"UTF-8文字セット"で*正確に*を意味しますか? UTF-8は*エンコーディング*です。ユニコード文字をバイトシーケンスとして表現するために使用されます。 –

+0

ウィキペディアを読んでください:http://en.wikipedia.org/wiki/UTF-8 – rkosegi

答えて

2

UTF-8で表現文字のセットは、Unicode文字セットとまったく同じです。

権限はUnicode Consortiumです。具体的にリストが必要な場合は、大きいリストhttp://www.unicode.org/Public/UNIDATA/UnicodeData.txtを含むUnicode文字データベースにリンクするhttp://www.unicode.org/ucd/にアクセスできます。ただし、一部の広い範囲は範囲と同様に示されているため、完全に明示的なリストではありません。 AC00からD7A3文字を全て(アルゴリズムconstructuredする名前を持つ)ハングル音節文字であると定義されていることを意味する

AC00;<Hangul Syllable, First>;Lo;0;L;;;;;N;;;;; 
D7A3;<Hangul Syllable, Last>;Lo;0;L;;;;;N;;;;; 

+0

http://stackoverflow.com/questions/8732025/why-degree-symbol-differs-from-utf-8-from-unicodeを参照してください。私は非常に非常に混乱している原因! –

関連する問題