speech-recognition

19熱

1答えて

私はその一般的な質問トピックを知っていますが、C++の中で最も速い音声認識ライブラリが何であるか知りたいですか？現在、私はkniectでMicrosoft SAPIを使用しています。それはうまく動作し、単語を認識するが、そのabitは遅い、単語を認識するために1,2秒かかる場合があり、私のケースでは、この遅れがユーザーの相互作用の問題を引き起こしている。カメが与えられたサンプルを確認したところ

6熱

1答えて

C++音声認識API

私はC++音声認識/音声認識APIを探しています。私はVOCEやポケットフェニックスをはじめとする数少ないものを経験しました。（必須ではありません）私の声を識別 - しかし、これは（私は、文字列の中に音声を変換し、それがコマンドであるか否かをチェックするために計画していた音声コマンド）テキストにスピーチスピーチに私の要件テキストです VOCE apiが私に求めているものを提供していないと思わ

5熱

1答えて

ウェブスピーチapi音声合成 - 音声リストを取得する

私はウェブのスピーチAPIに奇妙な問題があります。文字列を読み上げるためのコードをいくつか設定しました。まれに、通常の音声（Mac OS XのDictationとSpeech Settingsの「Alex」）でそれを話します。しかし、通常、それは "Albert"という声で語ります。私はここに記載されているW3CのWebスピーチAPIで探しています： https://dvcs.w3.org/hg

5熱

1答えて

RecognizerIntentを使用して音声をキャプチャするBufferReceived（）を構築する方法は？

私は、 RecognizerIntent.ACTION_RECOGNIZE_SPEECHを使用して、アンドロイドアプリケーションで作業しています。私の問題は、ユーザーが入力した音声をキャプチャするバッファを作成する方法がわかりません。私はスタックのオーバーフローで多くを読むが、私はちょうどどのように理解していない私はバッファと認識サービスコールを私のコードに戻します。そして、バッファに保存され

9熱

1答えて

誰でもCMU Sphinxを音声認識でプログラミングに成功させましたか

私は音声認識ソフトウェア（私がやる仕事の10-20％）でコーディングを始めたいと思っています。 Dragon Natural Speaking（DNS）ソフトウェアで成功した人もいますが、Macを使用していますが、残念ながらDragonはWindowsでしか動作しません。誰かがCarnegie MelonオープンソースSphinx http://cmusphinx.sourceforge.net

71熱

7答えて

Android（JellyBean）でのオフライン音声認識

サードパーティのアプリケーション用にGoogle Nowからオフライン音声認識を利用できるようになったようです。それはthe app named Utterによって使用されています。このオフラインスピーチレコーディングで簡単な音声コマンドを実行する方法を見た人は誰ですか？通常のSpeechRecognizer APIを使用するだけで、自動的に動作しますか？

14熱

5答えて

ページのGoogle音声検索の負荷

まずは、私が永遠に働くとは思っていない一時的なソリューションを作成しようとしています。もしあなたが望めば、ちょうど実験！私は以下の動作をしています！私がしようとしているのは、ページの読み込み時に音声検索を開始することです。これを実現する方法のアイデア！注：マイク入力を確認するには、クロムブラウザが必要です。 http://jsfiddle.net/dirtyd77/99amf/ <html

5熱

1答えて

Androidのオフライン音声認識APIを公開することはできますか？

doc/UAPI_User_Guide.pdfのJavaアプリケーションhereでAndroidのオフライン音声認識を使用するためのドキュメントが見つかりました。私が理解しているように、Androidアプリケーションでは使用できません（SDKでは利用できません）。私は正しい？このAPI用のラッパーを作成し、ユーザーアプリケーションに表示させる独自のAndroidモジュールを作成できますか？私は自分

5熱

1答えて

麻痺した人のための音声コマンドによる電話の終了

障害を持つ人々のための支援技術を作成する非営利団体を運営しています。私は四肢麻痺のクライアントと働いています。彼は手足を使うことができませんが、うまく話すことができます。彼は現在、音声コマンドを使用して自分のAndroid搭載端末のすべてを制御していますが、1つの重要な機能を除いて、音声コマンドを使用して終了する方法はありません。もちろん、彼は他の人が電話を切るのを待つことができますが、通話を終了

6熱

3答えて

アンドロイドでキーワードを有効にした音声認識

「google now」のこのクールな音声アクティベーション機能を自分のアプリケーションで使用することはできますか？私が望むのは、ユーザーがボタンまたはsthを押して起動をトリガーする必要がないということです。そうですね。私はむしろキーワードで自動音声認識を有効にしたいと思っています。例：「google now」が開かれているときは、「google」と言うだけです。そのコマンドの後、システム