ICUのルールフレームワークは、不規則な発音を持つソース言語とうまく動作しません。悲しいことに、英語は特に発音が難しいです。
音訳は、ターゲット言語のソース言語の発音をエミュレートします。これは、2つの部分からなる。(a)入力を、発音を示す中間表現に変換する。 (b)発音を最終出力に変換する。英語・ツー・ウルドゥー語で
、ルールベースのICUフレームワークは、(a)のための良好な結果を与えることはありませんが、それは非常に高い(B)を行うための良いシステムでしょう。私はあなたの英語の文字列をテキスト読み上げシステムで実行するか、または非常に大きな発音辞書で入力を調べることをお勧めします。これにより、International Phonetic Alphabetの発音が得られます。発音ができたら、ICUはウルドゥー語を生成するのにうまくいくはずです。
さて、ICUはまだウルドゥー語への国際音声記号を変換するためのルールを持っていません。 Unicodeの音訳ルールの管理者として、これは実装が非常に簡単であると思います。私は喜んでそれを行うときに私は時間を見つけるが(誰もがパッチを送信する歓迎です!)このルートに移動する場合はhttp://unicode.org/cldr/trac/newticketにバグを提出してください。
あなたはウルドゥー語をローマ字ウルドゥー語に変換することについて何かを見つけましたか? –