現在、私は韓国語のプログラムに取り組んでいます。これは中国語に翻訳する必要があります。私が奇妙に感じたことは、アプリケーションがUTF-8とUTF-16の文字を混ぜていることです。UTF-8とUTF-16を混ぜる
のは、私たちが行くと、文字列きたとしましょう:
"게임을 정말로 종료하시겠습니까"
8C AC 84 C7 44 C7 20 00 15 C8 D0 B9 5C B8 20 00
85 C8 CC B8 58 D5 DC C2 A0 AC B5 C2 C8 B2 4C AE 00
しかし、ちょうどゼロを防ぐために
B0 D4 C0 D3 C0 BB 20 C1 A4 B8 BB B7 CE 20 C1 BE
B7 E1 C7 CF BD C3 B0 DA BD C0 B4 CF B1 EE 3F 00
として格納されていますが。私はそれが何らかの暗号化であるかどうか知りたいのですが、文字列の途中の文字列の終わりを防ぐためにコンパイラが使う通常の方法ですか?なぜなら、最終結果は私が言及した最初の文字列です。どんな読書も強く感謝されます。
http://utf8everywhere.org/ –
それは昔マルチバイトエンコーディングを使用し、バイト値は、[コードページ949](https://en.wikipedia.org/wiki/に一致している参照してくださいCode_page_949)。 –
@HansPassantこのエンコーディングを通常のUTF-16文字列に変換する際のヒントを教えてください。 – mexikanoZ