2010-12-26 15 views
16

私は最終的にpocketsphinx(pocketsphinx_continuous)をビルドして実行することができました。私が取り組んでいる問題は、正確さを向上させる方法です。私が理解するところでは、辞書ファイル(-dict test.dic)を指定することができます。だから私は、デフォルトの辞書ファイルを取り、同じ言葉のいくつかのより多くの発音を追加して、例えば:Pocketsphinx - 単語を追加して精度を改善する

pencil P EH N S AH L 
pencil(2) P EH N S IH L 

spaghetti S P AH G EH T IY 
spaghetti(2) S P UH G EH T IY 

しかしpocketsphinxはまだまったくのいずれかの単語を認識しません。あなたが指定できるjsgfファイルがあることは知っていますが、それはフレーズと文法の方が多いようです。 pocketsphinxに鉛筆やスパゲッティなどの一般的な言葉を認識させるにはどうすればよいですか?

おかげで、このようなもので

-Mike

+0

誰でも?誰ですか?................ – Mike6679

+0

こんにちはマイク、 誰かがAndroidでpocketsphinxを構築して実行することができたらうれしいです。私も同じことをしたいと思うし、cmusphinxからダウンロードした "PocketSphinxAndroidDemo"をビルドするのに問題がある。sourceforge.net。 あなたの経験を共有し、どのようにしたかについてのステップを列挙できますか? 「pocketsphinx_continuous」とはなんですか?ポケットフィックスの別の支店ですか? ありがとう! gwofu – user602410

+0

user602410:pocketsphinx_continuousは、pocketsphinxディストリビューションに含まれるプログラムです。 –

答えて

6

、あなたが特定することはできませんが、私は次の提案を提供することができます

  1. をおそらく、言語モデルは何とか低い確率を持っています"スパゲッティ"と "鉛筆"のために。あなたが示唆したように、JSGFを使用して、N-gramモデルを使用しない場合の認識方法をテストすることができますが、代わりに単純な文法(スパゲティと鉛筆を含む20語のようなもの)を行います。こうすることで、おそらくこれらの単語を認識することを困難にする言語モデルであるかどうかを知ることができます。また、すべての単語が等しい確率を持つとみなしても問題ありません。

  2. おそらく、これらの言葉は、別の辞書項目であっても、貧弱に発音していると思われます。それが失敗したとき、それらを認識しているもの、また、

  3. http://cmusphinx.sourceforge.net/wiki/tutorialamを参照してください)あなたの声に音響モデルを適応A.テスト他の人のいずれかの声をお試しください、またはB.?可能であれば、誤って認識している単語を辞書から削除します。アコースティックモデルを適応させる、文法を制限し、そしておそらく、より高品質の録音入力を取得:

は再び、全体的な精度のために、3つしか物事は本当にあなたを助けしようとしています。

2

単語の後と発音の開始前にタブ(スペースではない)を入力してください。

4

精度を向上させるには、音響モデルをあなたの声に適応させてみてください。新しい単語を追加する方法を学ぶために http://cmusphinx.sourceforge.net/wiki/tutorialadapt

http://ghatage.com/tech/2012/12/13/Make-Pocketsphinx-recognize-new-words/

+0

新しい単語を追加する方法を学ぶためのリンクには404があります。どこにでも見つけることができますか? –

+0

デッドスレッドを復活させないのに、URLは次のように見えます。http://ghatage.com/2012/12/13/Make-Pocketsphinx-recognize-new-words/ – OldWolf

+0

正しいリンクは - http:// wwwです。 .ghatage.com/tech/2012/12/13/Make-Pocketsphinx-recognized-new-words。 permalink構造が変更されたようです。 – sabergeek

2

は問題がある可能性がありますがPocketsphinxです。私もPocketsphinxで良い結果を得ていませんでした。しかし、私はSphinx4(ノイズキャンセリングマイクを備えた米国のスピーカー)の精度は非常に良好でした。したがって、私は同じオーディオレコーディングを使用して2つの比較を行いました。 pocketsphinxについては、私はWSJオーディオモデルとpocketsphinx_batchと小さなボキャブラリ言語モデルと辞書(CMUケンブリッジ言語モデリングツールキットでオンラインで作成)を使用しました。Sphinx4では、Sphinx4ライブラリを使用して小さなJavaプログラムを作成しました。その結果、Sphinx4ははるかに正確でした。すべての詳細についてはhttp://www.jaivox.com/pocketsphinx.htmlです。

+0

面白い、共有ありがとう! – Mike6679

関連する問題