私は英語で書かれた文章や言葉を別の言語のスクリプトに翻訳するPHPスクリプトを書くことに興味があります(私は言語にとらわれない提案を歓迎します)。私はphoenetically(すなわち耳で)書かれた英語を見ているので、私は同じ単語の別のスペルを扱わなければならないだろう。PHPでのインテリジェントな音訳
標準的には(例えば、中国では、あなたがなど、簡体ウェイド持つ)ローマ字表記のために存在しないものとする
誰もが私が始めることができる場所に何かアドバイスはありますか?
EDIT:これは純粋に教育的目的のために行っていますが、私は当初IMメッセージのコーパスで見つかった異ったスペルの間の関係を理解するために、言語のローマ字化された形式)、あなたはある種の機械学習ツールを必要とします。しかし、正しい軌道に乗っているかどうかを知りたいのですが、この作業をするために次に調べるべきことを見つけ出すための助けが必要です(たとえば、どの機械学習ツールを調べるべきですか?) 。
- など(通常は、独自のスクリプトで書かれた)外国語のバリアントスペル」 「eheree」対「ehery」、または「ei」対「ey」である。私はそれほど大したことではないことを理解しています:私は、与えられたコーパス(例えばIMメッセージやローマ字のローマ字で書かれたFacebookの更新など)に対して少しの統計分析が必要な解決策を望んでいました。 – arkate