0
タイ語のキーボード入力を処理しています。いくつかのキーは母音記号で、特定の先行文字と結合したときにのみ使用できます。ここでタイの母音記号と無視するときのICU
0x0E33
は、たとえば0x0E1C + 0x0E33
については母音記号
が有効
ですが0x0E44 + 0x0E33
が有効でないと0x0E33
が無視されるべきです。
私は、母音記号を無視するか、それとも前の文字と組み合わせないかを知る方法を探しています。
どのようなアイデアをお願いしますか?
はい、私はその情報を取得するためにICUライブラリを使用することができます。しかし、タイ語の母音は、先行する特定の文字と組み合わせることしかできません。それ以外の場合はスペースが必要です(誤った組み合わせです)。私はそれが有効な組み合わせであるかどうかを判断する一般的な方法を理解しようとしています。 –
あなたが提供したリンク(タイ語のスクリプト用のUnicodeデータ)を見ると、あなたのコメントがどのように役立つか分かりません。私の例では、3つの文字すべてのカテゴリ値は同じです(Lo)。 –