私のアプリでは音声認識に開かれた耳を使用しています。大きな懸念は精度です。静かな環境では約50%の精度がありますが、騒がしい環境では状況は悪化します。ほとんど何も正しく認識されません。私は現在約300語の辞書ファイルを使用しています。正確さを向上させるために私が探すべき分野は何ですか?今まで私はこれを微調整していません。開かれた耳を音声認識に使用している間の精度は非常に低い
10
A
答えて
17
音声認識アプリケーションの設計では、音響モデル、文法、音声辞書などの音声認識の基本概念を理解する必要があります。 CMUSphinxのチュートリアルから詳細を学ぶことができますhttp://cmusphinx.sourceforge.net/wiki/tutorial
不正確さは音声アプリケーション開発の通常の状態です。それを改善してアプリケーションを有用にするプロセスがあります。あなたは語彙サイズはと遊ぶのが
トライを認識し、現在の精度を測定するための音声データベースを作成し、その後ろに問題を理解しようとしている
コレクトの音声サンプル:プロセスは以下のとおりです。さまざまな音声プロンプト間の分離を改善するためです。たとえば、10コマンドのボキャブラリは、300コマンドのボキャブラリよりも認識しやすくなります。
認識するバリアントの数が少なく、人の回答が簡単であるようにアプリケーションを設計します。 このアクティビティはVUI(音声ユーザーインターフェイスデザイン)と呼ばれ、数多くの素晴らしい書籍やブログ記事を含む非常に大きな領域です。ここにいくつかの詳細があります:http://www.amazon.com/Voice-Interface-Design-Michael-Cohen/dp/0321185765
アプリケーションのアコースティック部分を改善してみてください。あなたのスピーチに合うように辞書を修正してください。音響特性に合わせて音響モデルを適応させます。音響モデルの適応プロセスの説明については、http://cmusphinx.sourceforge.net/wiki/tutorialadaptを参照してください。
関連する問題
- 1. IBM Watsonの音声認識の精度が低い
- 2. 音声認識API「チーン」は非常に遅いです
- 3. Androidでフランス語の音素認識を使用したPocketsphinxの認識精度が低い
- 4. Python音声認識応答が非常に遅い
- 5. C#音声認識ライブラリを使用した音声UIまたは音声認識
- 6. C#非リストを使用した音声認識
- 7. 音声認識音声認識 - Ionic 2
- 8. sklearn.KNeighborsClassifierは非常に低い精度のスコアを与えます
- 9. 録音された音声が非常に低く、Androidに多くのノイズが記録されています
- 10. iOS 10音声認識の使い方
- 11. 音声認識?
- 12. 音声認識
- 13. 1分後に再開しない連続音声認識
- 14. AVAudioSessionの音が非常に低い
- 15. scikit非常に精度が低い分類器(Naive Bayes、DecissionTreeClassifier)
- 16. PRIORITY_HIGH_ACCURACYでも精度が非常に低い
- 17. マイクロソフトの音声認識速度
- 18. Windows 10の音声認識エンジンに新しい音声を追加する
- 19. C#非常に低い精度で一致するAForgeパターン - 私は間違っていますか?
- 20. ケラスRNNの誤差は非常に小さいが精度は低い
- 21. ケラスCNNトレーニングの精度は良いですが、テストの精度は非常に低い
- 22. Python - 音声認識の時間オフセット
- 23. Win7音声認識 - ユーザーを音声で認識しますか? .NETで
- 24. uwp音声認識
- 25. 音声認識ツール
- 26. 音声認識ループ
- 27. 音声認識Api
- 28. C#音声認識
- 29. Google音声認識APIをPythonで使用するには?
- 30. Android音声認識を使用してフレーズを認識する方法
answer.Iのおかげであなたはmentioned.Thereは、しかし、私は語彙サイズと
1.Playingの明確化を必要とするいくつかある4点についていくつかの研究は、アプリ以来、私のためのオプションではありませんでした編集可能な大きな単語リストを理解する必要があります。
2.私はvuiデザインに関する研究をしていないことを認めます。正確さの問題が深刻化しました。この状況では、私はその分野に突入するようにアドバイスしますか?VUIに関する研究はどれくらい時間がかかりますか? – humblePilgrim
Ok.Myの主な目的は、(ノイズの多い)クラスルーム環境でユーザーがポケンした単語を再確認することです。ユーザーは自分の選択した単語を辞書に追加することができます。この問題は正確さだけです。ユーザーは世界中のさまざまな地域にいるため、アクセントの問題は大きな問題です。実際のユーザーからオーディオサンプルを入手できるかどうかは疑問です。 – humblePilgrim
もちろん、問題はありますが、解決できる可能性があります。アクセントの問題は適応によって解決される。ルームリバーブの問題は、堅牢な機能で解決されます。ノイズは通常、アコースティック・フロントエンドのノイズキャンセルによってフィルタリングされます。あなたがこれに取り組むつもりなら、それはすべて実行可能です。 –