2011-10-20 4 views
7

4バイトの文字はどのようにC#で表されますか? 1つの文字または2つの文字のセットのように? C#が唯一charタイプにBasic Multilingual Planeから文字を格納することができるCで表される4バイト文字はどのように表されますか

var someCharacter = 'x'; //put 4 bytes UTF-16 character 
+0

「4バイト文字」の例を挙げてください。それはあなたの質問をより明確にするでしょう。 – jv42

+0

@ jv42には、2バイトで表現できないUTF-16文字がいくつかあります。したがって、2のうちのコードを持つ任意の文字です^ 16 – SiberianGuy

+2

Jon Skeetの "Unicode and .NET"記事を参照してください - http://csharpindepth.com/Articles/General/Unicode.aspx – sll

答えて

11

。この平面以外の文字については、surrogatesという2つのcharを使用する必要があります。あなたはまた、のような文字列リテラルを使用することができます

string s = "\U0001D11E"; 

UTF-16を参照してください。

関連する問題