speech-recognition

    19

    1答えて

    私はその一般的な質問トピックを知っていますが、C++の中で最も速い音声認識ライブラリが何であるか知りたいですか? 現在、私はkniectでMicrosoft SAPIを使用しています。それはうまく動作し、単語を認識するが、そのabitは遅い、単語を認識するために1,2秒かかる場合があり、私のケースでは、この遅れがユーザーの相互作用の問題を引き起こしている。 カメが与えられたサンプルを確認したところ

    6

    1答えて

    私はC++音声認識/音声認識APIを探しています。私はVOCEやポケットフェニックスをはじめとする数少ないものを経験しました。 (必須ではありません)私の声を識別 - しかし、これは(私は、文字列の中に音声を変換し、それがコマンドであるか否かをチェックするために計画していた音声コマンド)テキストにスピーチ スピーチに私の要件 テキストです VOCE apiが私に求めているものを提供していないと思わ

    5

    1答えて

    私はウェブのスピーチAPIに奇妙な問題があります。文字列を読み上げるためのコードをいくつか設定しました。まれに、通常の音声(Mac OS XのDictationとSpeech Settingsの「Alex」)でそれを話します。しかし、通常、それは "Albert"という声で語ります。 私はここに記載されているW3CのWebスピーチAPIで探しています: https://dvcs.w3.org/hg

    5

    1答えて

    私は、 RecognizerIntent.ACTION_RECOGNIZE_SPEECHを使用して、アンドロイドアプリケーションで作業しています。私の問題は、ユーザーが入力した音声をキャプチャするバッファを作成する方法がわかりません。私は スタックのオーバーフローで多くを読むが、私はちょうどどのように理解していない 私はバッファと認識サービスコールを私のコードに戻します。そして、バッファに保存され

    9

    1答えて

    私は音声認識ソフトウェア(私がやる仕事の10-20%)でコーディングを始めたいと思っています。 Dragon Natural Speaking(DNS)ソフトウェアで成功した人もいますが、Macを使用していますが、残念ながらDragonはWindowsでしか動作しません。 誰かがCarnegie MelonオープンソースSphinx http://cmusphinx.sourceforge.net

    71

    7答えて

    サードパーティのアプリケーション用にGoogle Nowからオフライン音声認識を利用できるようになったようです。それはthe app named Utterによって使用されています。 このオフラインスピーチレコーディングで簡単な音声コマンドを実行する方法を見た人は誰ですか?通常のSpeechRecognizer APIを使用するだけで、自動的に動作しますか?

    14

    5答えて

    まずは、私が永遠に働くとは思っていない一時的なソリューションを作成しようとしています。もしあなたが望めば、ちょうど実験! 私は以下の動作をしています! 私がしようとしているのは、ページの読み込み時に音声検索を開始することです。 これを実現する方法のアイデア! 注:マイク入力を確認するには、クロムブラウザが必要です。 http://jsfiddle.net/dirtyd77/99amf/ <html

    5

    1答えて

    doc/UAPI_User_Guide.pdfのJavaアプリケーションhereでAndroidのオフライン音声認識を使用するためのドキュメントが見つかりました。私が理解しているように、Androidアプリケーションでは使用できません(SDKでは利用できません)。私は正しい?このAPI用のラッパーを作成し、ユーザーアプリケーションに表示させる独自のAndroidモジュールを作成できますか?私は自分

    5

    1答えて

    障害を持つ人々のための支援技術を作成する非営利団体を運営しています。私は四肢麻痺のクライアントと働いています。彼は手足を使うことができませんが、うまく話すことができます。彼は現在、音声コマンドを使用して自分のAndroid搭載端末のすべてを制御していますが、1つの重要な機能を除いて、音声コマンドを使用して終了する方法はありません。もちろん、彼は他の人が電話を切るのを待つことができますが、通話を終了

    6

    3答えて

    「google now」のこのクールな音声アクティベーション機能を自分のアプリケーションで使用することはできますか? 私が望むのは、ユーザーがボタンまたはsthを押して起動をトリガーする必要がないということです。そうですね。 私はむしろキーワードで自動音声認識を有効にしたいと思っています。 例:「google now」が開かれているときは、「google」と言うだけです。そのコマンドの後、システム