2016-04-15 34 views
1

特定のドメインに固有の母国語のために、音声合成システムを構築しようとしています。 CMUSphinxを目的に使用していますが。珍しい言語のために、私が最初に理解し、あなたが言葉の可能なセットのための英語の音訳が含まれて発音辞書を構築する必要があります:CMUSphinxで音韻辞書を作成してテキストシステムに変換する

uniocode word -> english transliteration 

例:

xxxx -> ah ty re see 

私の質問があり、この音訳を手動で作成する必要がありますか? freetts [2]の間に来て、英語でうまくいくようです。新しい言語のためにどうすればいいですか? CMUSphinxのチュートリアルでカバーされている辞書を構築するための

答えて

0

可能な方法:

http://cmusphinx.sourceforge.net/wiki/tutorialdict

新しい単語のための既存の辞書を拡張したり、ゼロから新しい辞書を構築するためにあなたを助けるために、さまざまなツールがあります。あなたの言語にすでに辞書がある場合は、最高のパフォーマンスが得られるよう注意深く調整されているので、使用することをお勧めします。あなたが新しい言語を始めるなら、あなたは様々な縮小と補語効果を説明する必要があります。テキストをサウンドに変換するための正確なルールを作成することは非常に困難です。しかし、実際には、純粋な変換であっても、音声認識に良い結果が得られることが示されています。たとえば、多くの開発者は、簡単な書体ベースの合成でASRを作成することに成功しました。ここでは、各文字は対応する電話ではなく、それ自体にマップされています。

ほとんどの言語では、機械学習方法と既存の小規模データベースを使用して変換を行うために特殊な書記を使って音素(g2p)コードを使用する必要があります。今日最も正確なg2pツールはPhonetisaurusとsequitur-g2pです。

ほとんどのTTSパッケージにはG2Pコードが含まれています。たとえば、FreeTTS、OpenMary、espeakのg2pコードを使用できます。

TTSを使用する場合は、電話機の変換が必要な場合があります。 TTS電話機は通常、ASRに必要なものよりも広範囲です。しかし、通常は単純なG2Pよりも多くの必要な機能が含まれているため、TTSツールには大きなアドバンテージがあります。たとえば、数字や略語を音声形式に変換してトークン化を行っています。

+0

辞書ファイルをどのように生成する必要があるのか​​まだよく分かりません。私は最初にg2pツールで使用される英単語 - 英単語ファイルが必要ですか?ありがとう。 – Izza

+0

"unicode to English"は無意味です。 phonetisaurusのようなG2Pツールでは、ある程度の単語の音素列をリストする最初の辞書が必要です。このような辞書はテキストエディタで手動で作成できます。あなたは100単語を手動で列挙し、残りを拡張するためにPhonetisaurusを訓練することができます。 –

関連する問題