コンシューマデバイスでは(メインフレームではなく)合理的に一般的で、文字はA-Za-z0-9
とはASCIIとは異なる文字エンコーディングがありますか?文字の場合でもASCIIと異なるエンコーディング
現在、私はJavaアプリケーションについて考えているので、一部の国のJavaソフトウェアのカジュアルなユーザーがdefaultCharset
と報告されてしまう可能性があるかどうかは疑問です。"AZaz09".getBytes()
は"AZaz09".getBytes("UTF-8")
。私は、この点で異なる動作から生じるかもしれない特定の互換性の問題に対処する必要があるかどうかを試しています。
私は歴史的に、EBCDICがASCII互換でないエンコードの主要な例であることを知っています。しかし、それは最近の民生機器、あるいはIBMのメインフレームとヴィンテージのコンピュータだけで使用されていますか? EBCDICの遺産は、いくつかの国の共通のエンコーディングで生きていますか?
また、UTF-16はASCIIと互換性がなく、Windows上でファイルをそのようにエンコードすることはかなり一般的です。しかし、私が知る限り、これは常にファイルの内容であり、デフォルトのアプリケーションロケールではありません。ユーザーは、少なくとも半分のアプリケーションを壊すことなく、UTF-16をシステムコードページとして使用するようにWindowsマシンを構成することは可能ですか?
私が知る限り、アジアで使用されるすべてのUnicode前のマルチバイトエンコーディングは、ASCII範囲00-7Fを少なくとも文字と数字にASCIIと互換性のあるものにマップします。まだ使用中のアジア系エンコーディングはありますか?の場合、すべて1バイト以上を使用します。コードポイント?あるいは、おそらく他の大陸で?
おかげです。残念ながら、これらの文字セットがアプリケーションのデフォルトの文字セットとしてどのくらい一般に使用されているかを判断するのは難しいです。コードページの流行統計などはまだ見つかりませんでした。 IBMのページは、DOSやメインフレームのように聞こえる。 JIS X 0212はASCII互換のEUC-JP内で使用されていたようです。 ISO-2022-CNは、復号化にのみ使用できます。 – MvG