可能な方法:
http://cmusphinx.sourceforge.net/wiki/tutorialdict
新しい単語のための既存の辞書を拡張したり、ゼロから新しい辞書を構築するためにあなたを助けるために、さまざまなツールがあります。あなたの言語にすでに辞書がある場合は、最高のパフォーマンスが得られるよう注意深く調整されているので、使用することをお勧めします。あなたが新しい言語を始めるなら、あなたは様々な縮小と補語効果を説明する必要があります。テキストをサウンドに変換するための正確なルールを作成することは非常に困難です。しかし、実際には、純粋な変換であっても、音声認識に良い結果が得られることが示されています。たとえば、多くの開発者は、簡単な書体ベースの合成でASRを作成することに成功しました。ここでは、各文字は対応する電話ではなく、それ自体にマップされています。
ほとんどの言語では、機械学習方法と既存の小規模データベースを使用して変換を行うために特殊な書記を使って音素(g2p)コードを使用する必要があります。今日最も正確なg2pツールはPhonetisaurusとsequitur-g2pです。
ほとんどのTTSパッケージにはG2Pコードが含まれています。たとえば、FreeTTS、OpenMary、espeakのg2pコードを使用できます。
TTSを使用する場合は、電話機の変換が必要な場合があります。 TTS電話機は通常、ASRに必要なものよりも広範囲です。しかし、通常は単純なG2Pよりも多くの必要な機能が含まれているため、TTSツールには大きなアドバンテージがあります。たとえば、数字や略語を音声形式に変換してトークン化を行っています。
辞書ファイルをどのように生成する必要があるのかまだよく分かりません。私は最初にg2pツールで使用される英単語 - 英単語ファイルが必要ですか?ありがとう。 – Izza
"unicode to English"は無意味です。 phonetisaurusのようなG2Pツールでは、ある程度の単語の音素列をリストする最初の辞書が必要です。このような辞書はテキストエディタで手動で作成できます。あなたは100単語を手動で列挙し、残りを拡張するためにPhonetisaurusを訓練することができます。 –