2017-01-05 44 views
-2

私はNLPを含むプロジェクトを行っています。私はタミール文字列を「இல்லை」〜「illai」のような英語の文字列に変換する必要があります。タミール文字列をJavaの英語文字列に変換する方法

私はどのようにそれをjavaを使って行うことができますか? コードサンプルを手助けしてください

+0

[Google Translate API](http://stackoverflow.com/a/16325094/4541045) – ti7

+0

実際に依存している文字は、英語の値に直接変換できますか、英語バージョンの変更は一連のルールに基づいていますか? –

+4

あなたは、タミール語の文字をローマ字に変換するために、音訳を探しているようです。翻訳ではなく、「翻字」を検索します。これは別のものです。 – rossum

答えて

0

Tamil blockには72文字しかないので、変換テーブルを作成し、文字を翻訳する前に各文字を翻訳してリストに追加する前に、新しい文字列を作成してください。たとえばU+0B87については

(இ)はi

は、Javaに精通しているおよび/または変換する材料の非常に大量にある場合は、プロセスをスピードアップするためにいくつかの処理の最適化が可能性がありますになりますが、私は上記が良い解決の基盤になると思う。

翻訳する素材がわずかである場合、またはこれは単発的な仕事の場合は、単にGoogle Translateを使用して入力ボックスの下に入力変換を適用する方が理にかなっています。