2016-09-20 3 views
2

いくつかのコードポイントのテキストと対話の表示のセレクタがあるとすれば、これらのコードポイントの適切な分解形式は何ですか?たとえば、❤︎(U + 2764)はデフォルトでテキスト表示になりますが、VS-16(U + fe0f):❤followedが続くと絵文字になります。 VS-15(U + fe0e)でテキスト表現を強制することができます。つまり、U + 2764のNFDはU + 2764 U + fe0eになるはずですか? U + 2764 U + fe0eとU + 2764を同じ(U + 00e9)がé(U + 0065 U + 0301)と同じ方法で扱われるべきか?テキストとemoji表現はどうですか?彼らは同じように扱われるべきでしょうか?絵文字と比較の適切なNFD形式

+0

興味深いことに、この質問の❤︎(U + 2764)はAndroidの絵文字として表示されますが、ChromeのOS Xのテキストとして表示されます。私は❤︎(U + 2764 U + fe0e)が何をするのだろうかと思います。まだ絵文字だから、それはバグです。 –

答えて

1

emojisとバリエーションセレクタの場合は、Unicode databaseには、decomposition mappingはありません。標準even states

バリエーションシーケンスの最初の文字は決して正準分解能ではありません。

これは、バリエーションセレクタの有無にかかわらず、emojisはNFDで変更されないことを意味します。

私の知る限り、Unicodeはバリエーションセレクターのないコードポイントのデフォルト表現を指定していません。これは実装次第です。

関連する問題