私が分かっている限り、コード化された文字セットは、(抽象的な)文字(例えば、ユニコードのコードポイント00FCへのドイツ語の文字)に数字(コードポイントと呼ばれる)をマッピング/割り当てます。(コード化された)文字セット - ユニコードのコードポイントにマッピングする理由
このコードポイントが異なる方法で(例えば、バイトパターンで表される)符号化することができる。
UTF-8(1バイト)、UTF-16(2バイト)とUTF-32(4バイト)
そこでプロセスである:
(要約)文字コード・ポイントへ--->マップ(符号化された)文字セット - 1コードポイントの>エンコーディング... nバイト
なぜ、この中間段階コードポイントの? (抽象)文字が1 ... nバイトに直接マッピングされないのはなぜですか?
(アブストラクト)文字 - >マップ1 ... nバイト
この中間段階(文字に番号を割り当てる)が、他の(符号化された)文字セットで行われます。だから、それには十分な理由があるはずです。
バイトへの直接マッピングが行われない理由、およびこの中間段階を持たず直接バイトにマッピングされる文字セットがある理由を理解したいと思います。事前に
おかげで...
[絶対に絶対最小すべてのソフトウェア開発、ポジティブUnicodeと文字セット(を知っている必要があります言い訳はありません!)](https://www.joelonsoftware.com/2003/10/08/the-absolute-minimum-every-software-developer-absolutely-positively-must-know-about-unicode-and-character- –