2013-04-05 7 views
19

私はその一般的な質問トピックを知っていますが、C++の中で最も速い音声認識ライブラリが何であるか知りたいですか?最速音声認識ライブラリC++

現在、私はkniectでMicrosoft SAPIを使用しています。それはうまく動作し、単語を認識するが、そのabitは遅い、単語を認識するために1,2秒かかる場合があり、私のケースでは、この遅れがユーザーの相互作用の問題を引き起こしている。

カメが与えられたサンプルを確認したところ、カメが認識された単語に従って右に移動しますが、少し遅くなっています。

私はロボットが音声認識を使用して "左"と "右"と言うような場合に使用できるsapiというより高速のライブラリがあるのだろうと思っていましたが、ロボットは1,2ユーザーに少し不快感を与えます。

+1

これについていくつかの深い研究を行うべきです。 –

答えて

9

問題は高速ではなく、APIを使用する適切な方法です。音声認識は時間がかかるプロセスなので、録音と並行してと記録されるとすぐに音声の認識を開始することが主なトリックです。そして、最後の瞬間には、ほとんどすべての結果が得られ、すぐに反応することができます。

このようにして0.2秒の応答時間を達成できますが、これを実装するにはより柔軟なAPIが必要です。良い選択はCMUSphinx、あなたの実装に使用できるオープンソースの音声認識フレームワークです

+0

「私はあなたにかなり同意しています。それは道徳的なものです。」 - あなたはそれをどのようにプログラムするかを知る必要があります。 – SChepurin