0
からは、なぜC#のUTF-8バイトの混乱
System.Text.Encoding.UTF8.GetString(new byte [] { (byte)0xa0 });
は
"\u00a0"
にはなりませんか?
代わりに"\ufffd"
が届いています。
https://en.wikipedia.org/wiki/Non-breaking_spaceによると、0xa0はUTF-8で有効な改行なしスペースである必要があります。
ああ、ありがとう。だから、もし私が8バイトのテキストを0xa0のバイトがスペースであると考えられたら、それはおそらくLatin1のエンコードでしょうか? – CoderBrien
U + 00A0から0xA0にマップするエンコードがいくつかあります。 Latin-1(その名前のISOとWindowsのエンコーディングのあいまいさが曖昧です)は確かではありませんが、確かではありません。 –
@CoderBrien:おそらく、おそらく。または他の昔ながらの1バイトエンコーディング。 –