2017-03-15 33 views
1

私はロシア語の音声認識が必要です。私はproject pageからチュートリアルに従った。私はCMU Sphinxの音声言語モデルの作成方法は?

を参照してくださいチュートリアルで

あなたは、テキストを取るあなたのlangaugeのための発音辞書を使って発音ストリングに変換することができます。単語を対応する転写で置き換えてください。電話の数が少ないので、テキストも大きくないはずです。単なる本だけです。

しかし、どこで音声辞書を見つけることができますか?どのようにして、その言葉を全書籍の対応する転写に置き換えることができますか?

または完全な音声モデルを見つけることができますか?

SILのI0のLJ J a1をi1のLJ FJ E0 V GJ E1 NJ I0 jのPJ E0 TR O1 VZ O0リットルO0トンO1:

は、私はラインを持つファイルtest.txtのを作成し

を更新しましたSIL

これは、ロシア語で置き換えられた表形式のwavファイルであり、発音表現形式辞書(ru.dic)になります。

は、それから私は、コマンドでモードを構築するためにSRILMを使用:

NGRAMカウント-interpolate -t​​ext test.txtの-lm test.phonetic.lm

次私はコマンドでそれを起動します。

無-infile testModelの\デコーダ-test.wav -remove_noiseデバッグ\ Win32の\

pocketsphinxの\ビン\ pocketsphinx_continuous.exe -samprate 16000 -allphone testModel \ test.phonetic.lm -hmm cmusphinx-RU-5.2 -backtraceはい

しかし、私はそれを使用すると、間違った音韻で誤った結果が表示されます。

答えて

0

しかし、どこで音声辞書を見つけることができますか?私は、一冊の本では、それらに対応する転写に単語を置き換えることができますどのように

https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/Russian/cmusphinx-ru-5.2.tar.gz/download

内部

ファイルru.dic? Pythonの

内のスクリプト

Or..whereで

私は完全な音素モデルを見つけることができますか?

自分で作成する必要があります。

+0

申し訳ありません、もっと詳しく説明できますか?私はまだそれをすることはできません。 – gado

+0

私の最初の投稿を更新しました – gado

+0

新しいトピックに関する新しい質問をし、問題を再現するためにデータファイルを提供する必要があります。 –

関連する問題