speech-recognition

    2

    1答えて

    ホームオートメーションプロジェクトの一部として、ロックされたWindowsコンピュータで実行する必要がある音声認識プログラムを作成しようとしています。しかし、SpeechRecognitionEngineは、コンピュータがロックされているときに認識を停止しているように見えます(コンピュータがロックされていない状態でも継続します)。 私の現在のテストプログラムは次のようになります。 using Sy

    1

    2答えて

    私はWeb Speech APIを使用して自分のウェブページで音声コマンドをキャプチャしていますが、一定時間後に認識機能は終了します(リスニングを停止し、onendイベントを発生させます)。 どうしてですか?それを防ぐことはできますか? 音声認識ページ(40行)を使用してエラーを再現するために必要なコードはすべてここにあります。認識装置がリッスンを停止すると、「終了」を警告します。 <h1>Voi

    1

    1答えて

    ユニバーサルWindowsデモアプリケーション(link)のSpeechAndTTSサンプルでは、​​連続したディクテーションの例でも、ユーザーが認識ツールを開始するためにボタンをクリックする必要があります。 私は常に聞くSpeechRecognizerをどのように実装できますか? "Hey Cortana"や "Okay Google"のようなものを聞くと有効になります。 私は考えることができる

    3

    1答えて

    他のChromeタブでwebkitSpeechRecognitionを使用しているかどうか確認できますか? WebkitSpeechRecognitionを使用しようとしたときに別のタブがそれを使用していると、メッセージが表示されずにエラーが「中止」されます。私はwebkitSpeechRecognitionが別のタブで開いているかどうかを知ることができたいと思っています。もしそうなら、ユーザに通

    0

    1答えて

    私のモバイルアプリケーションで音声認識を追加するには、ionic 1.7.16でビルドしてください。私はAndroidとIosで動作する良いプラグインを探しています。ここで 私はインターネット上で見つかったプラグインの一覧と、私はそれらを使用しない理由: XSpeechRecognizer:のみのAndroidため annyang:イオス 上では動作しませんGoogleのテキストへのスピーチ:のみ

    0

    1答えて

    私は "google for search"の後に私が言うことでgoogleを検索しようとしています。明らかに、私が考えるリソースのすべてを上のリソースリストに追加することはできません。誰かが私を正しい方向に向けることができますか? は、ここで私は if(r == "search google for") { System.Diagnostics.Process.Start(

    0

    1答えて

    私はsphinx4サンプルでTranscriberデモを実行しています。しかし、精度は低いです。 Transcriberのソースでは、htmlファイルの1つは、このデモは数字用で、数字以外のデータを転記するとconfig.xmlを修正すると言います。それは "あなたの目的のために構成ファイルを変更する方法については、「プログラマーズガイド」を参照してください。しかし、私はconfig.xmlを変更

    0

    1答えて

    複数の人が話しているかどうかをリアルタイムで検出する方法はありますか?そのために音声認識APIが必要ですか? 私はオーディオを分離したくないし、それも転記したくない。私のアプローチは、1つのマイク( - >モノ)を使用して頻繁に録音し、その録音を分析することです。しかし、私はどのようにして声を識別して区別しますか?私は関連する周波数だけを調べることでそれを絞り込んでいますが、それでは... これは

    1

    1答えて

    Bing Voice RecognitionのREST APIから短い口述の回答を得ることができました。私の目標は、15-30秒(長い口述モードともいう)よりも長いオーディオファイルに対する応答を得ることです。それでは、私は短い答えを得るために次の操作を行いますされて(私はHTML UWPアプリを開発しています): はArrayBuffer送信 アクセストークンによる認証 オーディオファイル(WA

    1

    1答えて

    オプションのパラメータmaxnbestは常に無視され、レスポンスは常に(少なくともfr-Fr言語では)単一の結果を含みます。 複数の結果を得る方法/回避策はありますか?