speech-recognition

    0

    1答えて

    私はクラウド音声APIストリーム認識サービスを実装しました。私はFLACファイルを渡して出力を得ることができますが、それは継続的に認識しておらず、まだ話しかけていません。私の録音が完了したら、私は唯一の私はクラウドAPIからの応答を得ています。 Google音声APIから継続的な認知を得る方法をアドバイスしてください。 助けてください

    0

    1答えて

    音声をテキストに変換するAPIはありますか? ArtyOm.js、Speech APIなどのようなものはほとんど見つかりませんでしたが、Chromeブラウザのみに対応しています。 SafariとChromeの両方またはSafariのみで動作するものはありますか? TIA

    3

    1答えて

    私は音声認識を使用していますが、十分なコンテキストがある場合は非常にうまくいきます。私は数値入力のためだけに音声認識を使用しており、問題を見ています。たとえば、1桁の数字(2〜、〜、8桁など)を入力します。十分な文脈がない。あるいは、2桁の数字でさえ(80は馬鹿として翻訳されることもあります)。入力が数字になることを音声認識装置に伝えたいと思います。例えば、入力が「番号2」である場合、音声認識装置

    0

    1答えて

    私はビデオを録音していると同時に、スピーチダイアログなしで音声 - テキスト認識機能を実装したいと思っているアプリを作っています。

    0

    2答えて

    Androidでandroid.speech.SpeechRecognizerを使用しています。 場合によっては、isRecognitionAvailableがfalseを返すため、音声を認識できません。 電話でandroid.speech.SpeechRecognizerを有効にする方法はありますか? または類似のサービスはありますか?

    0

    1答えて

    私はユーザーの声を録音すると同時にそれを転記するアプリケーションを作成しようとしています。私はこの作業を行うためにAVFoundationとSpeechフレームワークを使用しています。問題はAppleが1分に転写時間を制限していることです。だから、この期間の後、私は音声認識要求を思い出してください。問題は、同時に声を録音したいということです。 この問題を解決する方法を知っている人はいますか? これ

    1

    1答えて

    継続的に生成される多数の.wavファイルに対して音声認識を実行したいと思います。 は、オンライン音声からテキストへのAPIサービスが増えあります(例えばGoogle Cloud Speech、Amazon Lex、Twilio Speech Recognition、Nexmo Voiceなど)接続されたアプリケーションのためにうまく動作しますが、このユースケースには適していませんでしょうが原因コス

    0

    1答えて

    私は、Google assit api、音声認識、音声対話サービスを使用するアプリを作っています..すべてがうまくいくようですが、私のアプリがデフォルトのアシスタンスアプリとして設定されています。私がそうすると、音声認識は記録的なオーディオ許可が与えられていないように機能しなくなりますが、設定ではうまくいきます。 誰かが問題になる可能性はありますか?

    0

    1答えて

    私のマイクでSpeechRecognitionを使用していて、speechSynthesisでデータが返されています。 私は、このページを読み上げる際に女性の声にして、「男性の声」と言って男性の声に切り替えることができるようにしたいと考えています。私は後で反対をすることができるようにしたい - それは男性の声に設定すると、 "女性の声"と言うと、それは戻って切り替える。 私は現在それを行うことがで

    0

    1答えて

    私は、AndroidのSpeechRecognizerを使用してユーザーの声を認識しました。 Google Appをアンインストールするまでうまくいきました。 (https://play.google.com/store/apps/details?id=com.google.android.googlequicksearchbox&hl=en) 私はGoogle Appを更新しましたが、「認識サー