speech-recognition

4熱

1答えて

私は連続音声認識を使用しているアプリケーションを作成しています。先日、私の携帯電話をAndroid 6.0.1にアップデートしたときまではうまくいっていたので、これがコードを壊したものだと仮定しています。ほとんどの場合、スピーチレコグナイザはERROR_NO_MATCHエラーをスローし、5秒間リスンする予定のときに再起動する前に、1秒未満の入力を待ちます。それはアプリケーションにコマンドを言うのは

8熱

2答えて

Androidの音声認識API重複フレーズ

私は、speech recognition APIの結果フレーズをAndroidで重複しています（デスクトップには重複しません）。各フレーズについて、2つの結果を返します。まず一つはで2つ目は、見ての通り、第2の戻りで、フレーズが複製され、各コピーがfinalとしてマークされている2つ目は超えているですresultIndex。最初のリターンでは1つのコピーしかありません。それはfinalで、

2熱

1答えて

OSXでの音声認識

OSXの音声対テキストツールをプログラムで使用するにはどうすればよいですか？ OSXにはオフラインの「拡張ディクテーション」があります。これは基本的には、コンピュータのどこかで音声を音声に変換するために必要なすべてのデータであることを意味します。私は実行可能ファイルからこれらの機能を呼び出すことを望みます。 AppleScriptファイルの中には基本的にこれがありますが、OSXで動作させることはで

1熱

1答えて

Sphinx4でライブスピーチを認識するjava api

私はSphinx4を使ってライブ音声認識のチュートリアルプログラムを実行しようとしています。 public class LiveRecognition { public static void main(String[] args) throws Exception { Configuration configuration = new Configuration();

1熱

1答えて

ユーザーにマイクが接続されているかどうかを確認する

ブラウザで音声認識がサポートされているかどうかをチェックし、サポートしているかどうかを警告する機能があり、ユーザーがGoogle Chromeを使用しているときは何でも、マイクは差し込まれていません。マイクが差し込まれているかどうかを確認したいと思います。それは可能ですか？ function recognize() { window.speechRecognition = window.sp

4熱

1答えて

スレッド「AWT-EventQueue-0」の例外javax.speech.EngineStateError：無効なEngineState

こんにちは私は、音声合成と音声認識の両方が必要なので、アプリケーションでVOCEライブラリ（freeTTSとSphinx4を使用しています）を使用しています。ここでは私の音声認識コードは、私は継続的にカウンタの値が0または1に変更されており、そうでない場合はmainメソッドが呼び出されたかどうかを確認してstartApplicationと呼ばれる別のJavaアプリケーションから、これでこれを呼び

-1熱

1答えて

アンドロイドのテキストへのヒンディー語の音声

変換するフリーのAPIやその他の方法は、ヒンディー語の音声をアンドロイドのヒンディー語のテキストに変換しますか？スピーチは1分ほどかかることがありますのでご注意ください。オンラインまたはオフラインは関係ありません。また、アンドロイドスタジオで実装する方法を述べてください。

6熱

1答えて

Pythonで音声認識で1単語を検出するには

私はPythonで音声を検出する方法を知っていますが、この質問はより具体的です： Pythonが単語を1つだけ聞いて、。私が知っている、私はPythonはすべての時間を聞いてみましょうし、その擬似コードのようなものを作ることができます： while True: if stt.listen() == "keyword": return True 私はすでにそれをした、

5熱

1答えて

LSTMバイナリ分類のための音声データセットの構築

私はtheanoを使用してバイナリLSTM分類を実行しようとしています。私は自分のコードを作成したいのですが、サンプルコードを読みました。「Hello」&私が使用している小さな録音があります。私はそれらのMFCC機能を抽出し、これらの機能をテキストファイルに保存して、これらを前処理します。私は20のスピーチファイル（それぞれ10）を持っており、各単語のテキストファイルを生成しています。したがっ

5熱

1答えて

フレームの音声データを分割してMFCCを計算する方法

自動音声認識エンジンを作成する基本的なステップについて理解しています。しかし、私は、セグメンテーションがどのように行われ、どのようなフレームとサンプルが得られるかという明確なアイデアが必要です。私が知っていることを書き留めて、私が間違っている場所で私を修正し、さらに私を案内する答えを期待します。音声認識の基本的なステップ、私はそれを知っているよう：（私はファイル）入力データはWAV/OGG（ま