私はロシア語の音声認識が必要です。私はproject pageからチュートリアルに従った。私はCMU Sphinxの音声言語モデルの作成方法は?
を参照してくださいチュートリアルで
あなたは、テキストを取るあなたのlangaugeのための発音辞書を使って発音ストリングに変換することができます。単語を対応する転写で置き換えてください。電話の数が少ないので、テキストも大きくないはずです。単なる本だけです。
しかし、どこで音声辞書を見つけることができますか?どのようにして、その言葉を全書籍の対応する転写に置き換えることができますか?
または完全な音声モデルを見つけることができますか?
SILのI0のLJ J a1をi1のLJ FJ E0 V GJ E1 NJ I0 jのPJ E0 TR O1 VZ O0リットルO0トンO1:
は、私はラインを持つファイルtest.txtのを作成し
を更新しましたSIL
これは、ロシア語で置き換えられた表形式のwavファイルであり、発音表現形式辞書(ru.dic)になります。
は、それから私は、コマンドでモードを構築するためにSRILMを使用:
NGRAMカウント-interpolate -text test.txtの-lm test.phonetic.lm
次私はコマンドでそれを起動します。
無-infile testModelの\デコーダ-test.wav -remove_noiseデバッグ\ Win32の\pocketsphinxの\ビン\ pocketsphinx_continuous.exe -samprate 16000 -allphone testModel \ test.phonetic.lm -hmm cmusphinx-RU-5.2 -backtraceはい
しかし、私はそれを使用すると、間違った音韻で誤った結果が表示されます。
申し訳ありません、もっと詳しく説明できますか?私はまだそれをすることはできません。 – gado
私の最初の投稿を更新しました – gado
新しいトピックに関する新しい質問をし、問題を再現するためにデータファイルを提供する必要があります。 –