ラテン文字(またはラテン語の発音記号、Devanagari letters)と言うと、異なるユニコードブロックの発音区別符号を追加する方法は誰にも分かりますか?たとえば、ブロック間の発音区別符を組み合わせるUnicode
Oै
私はその間にゼロ幅結合を試みましたが、効果はありませんでした。何か案は? 例えば、アラビア語の発音区別符を組み合わせるとラテン語の文字で動作しますが、ヘブライ語では動作しません。これはランダムですか?
ラテン文字(またはラテン語の発音記号、Devanagari letters)と言うと、異なるユニコードブロックの発音区別符号を追加する方法は誰にも分かりますか?たとえば、ブロック間の発音区別符を組み合わせるUnicode
Oै
私はその間にゼロ幅結合を試みましたが、効果はありませんでした。何か案は? 例えば、アラビア語の発音区別符を組み合わせるとラテン語の文字で動作しますが、ヘブライ語では動作しません。これはランダムですか?
Chapter 2、第2.11項「結合文字はすべて任意の基本文字に適用でき、原則としてスクリプトで使用することができます」したがって、Oの後に続くDevanagari母音記号ai U + 0948は許可されます。しかし、標準では次のように付け加えています。 "これは、すべての可能な組み合わせを同等にうまくサポートする実装上の義務を作成しません。したがって、漢字やデーバナガリ子音にアラビア語の注釈マークを付けることは許可されていますが、レンダリングや意味を成立させることはできません。」
これは実装までです。しかし、いくつかの "クロススクリプト"の発音区別符号があります。例えば、鋭いアクセントはギリシア語のtonosマークで統一されているので、ラテン文字éとギリシャ文字έは分解されると、同じ発音区別語U + 0301を含みます。さらに、この結合マークはキリル文字の後に置くことができ、これは通常の(比較的まれな)使い方と見なすことができるので、正しく実装するための良い実装が期待できます。
私は可能でしょう。このような何かを_why_表示されません。なぜあなたはそれを持っていないスクリプトに発音区別符号を追加したいのですか? – Oded