2017-02-04 7 views
0

ASCIIが文字を表すのに7ビットを使用する場合。誰かが、サポートされている文字の数にこの意味がどのようなものかを説明することができます。 ASCIIが文字あたり12ビットを使用した場合、どのように変更されますか?ASCIIが文字あたり12ビットを使用する場合はどうなりますか?

+0

ASCIIは文字0..127のみを定義するため、7ビットしか必要としません。あなたが12ビットを持っているならば、それはまだ7ビットしか必要としません。 –

+0

ASCIIは1つの標準です。 Unicodeは別のものです。なぜあなたはいくつかの文脈を得るためにユニコードに関するいくつかの研究をしないのですか? –

答えて

2

ビットには2つの状態があります。 nビットのグループは、2 nの可能な状態を有する。

ための7ビットは2 = 128個の可能な文字を表すことができ、12ビットが2 = 4096の可能な文字を表すことができます。

0

Wikipedia's table of character setsからこの要約抜粋は、歴史的な視点を提供する:

BCDIC   1928      6 bits Introduced with  
                the IBM card   

    FIELDATA  1956      6/7  Battlefield   
              bits information (USA)  

    EBCDIC  1963      8 bits IBM computers   
                Teleprinters and  
                computers;   

    ASCII   1963-06-17    7 bits original    
       (ASA X3.4-1963)     definition of   
                ASCII     

    ECMA-6  1965-04-30    7 bits ASCII localization 

    ISO 646  1967 (ISO/R646-1967)  7 bits ASCII localization 

       1967 (USAS      Close to "modern"  
    ASCII   X3.4-1967)    7 bits definition of   
                ASCII     
                IBM data    

    Braille ASCII 1969      6/7  Tactile print for  
              bits blind persons   

                Terminal text   
    ECMA-48  1972      7 bits manipulation and  
                colors    

    ISO/IEC 8859 1987      8 bits International   
                codes     

                Unified encoding  
    Unicode  1991      16/32 for most of the  
              bits world's writing  
                systems    
+0

Unicodeのエントリは少し誤解を招くことがあります。 Unicodeコードポイントは0x10FFFFまで上がり、21ビットになります。 – melpomene

+0

@melpomene、2^21 = 2097152これは次のものと一致します:* "Unicodeコード空間は、それぞれ65,536(= 216)コードポイントを持つ17のプレーン(基本多言語プレーンと16個の補助プレーン)に分割されています。 Unicodeコードスペースのサイズは17×65,536 = 1,114,112です。 " - - [Code Point(WP)](https://en.wikipedia.org/wiki/Code_point)おそらくUnicodeのデザイナーは、標準が成長するために。 – agc

0

12ビットコードは12個のまたは4096文字に2をサポートし、マイナスヌルような非文字の一つまたは二つ、多分脱出、及びAができます空白文字はほとんどありません。

これで12ビットのバイトでコンピュータを構築できました。しかし、これは高価なリエンジニアリング作業になります。ほとんどのコンピュータは、少なくとも部分的にasciiのために、8ビットのバイトを持っています。

しかし、アスキーを拡張するために選択されたメソッドはUnicodeであり、標準として出現しているエンコーディングはUTF-8です。これはアスキーのスーパーセットです。アスキーはユニコードです。未使用のトップビットが設定され、拡張された非ラテン文字を生成するために追加のバイトが追加されます。可変幅エンコーディングであるため、コードは常に8ビットの倍数であり、範囲の先頭にコードを追加することができるという点でわずかにオープンしていますが、現在のところエンコーディングは4バイトを超えることはありません。

関連する問題