speech-recognition

    7

    1答えて

    結果はnilで、私はデバッグと 以下 Error Domain=kAFAssistantErrorDomain Code=1101 "(null)" ようなエラーが表示 let urlpath = Bundle.main().pathForResource("myvoice2", ofType: "m4a") let url:URL = URL.init(fileURLWithPath:

    2

    1答えて

    Java Sphinx4 APIを使用してリアルタイムで音声を認識していますが、ソースファイルで使用できるすべてのデモを行っていますが、どのデモを処理するかを特定できませんでした。 また、どのように入力wavファイルをリアルタイムで取り込んでテキストに変換するために、デコレーションを使用することができますか。 私はリアルタイムでテキストに変換するパイロットコマンドを必要とする音声対応シミュレーショ

    0

    2答えて

    セッション・ベースの音声認識インターフェースの使用に問題があります。具体的には、長いオーディオストリームを複数のチャンクに分割し、一度に1つずつアップロードし、最後に完全な解析済みテキストを受信しようとしています(単一のソースからチャンクされたオーディオをストリーミングするのではなく)。 IBM Watson'sは、音声認識に対するステートレス・インターフェースとステートフル・インターフェースの両

    8

    1答えて

    SpeechRecognizerは、Google Apps(GApps)を搭載したAndroidでうまく機能します。しかし、中国では、ほとんどのAndroid搭載端末がこれらのGoogle Appsを削除します。 SpeechRecognizerを使用するとどうなりますか?実際のデバイスなしでどうすればテストできますか? CustomListener()はRecognitionListenerを実

    1

    1答えて

    EDIT:それは不明確だったので、私は質問をより具体化させます。 pocketsphinxの数値出力は何を意味しますか? < INFO: cmn_prior.c(149): cmn_prior_update: to < 55.55 10.06 -1.22 10.50 -3.09 1.89 -8.37 -9.24 -5.98 -4.85 4.65 -3.25 -3.95 > < INFO: fsg

    0

    1答えて

    スペイン語の音響モデルとJSGF文法で音声認識にpocketsphinxを使用しています。 しかし、少なくとも私の耳には、完全に分かりやすいような音で誤った認識結果が出ています(背景ノイズ、サンプリング周波数、音響モデルパラメータなどによるビット深度などはあまりありません)。 また、正しく認識されていないこのオーディオは、正しく認識されているものと大きく異なるようには見えません(実際には私にとって

    4

    1答えて

    私はJavaアプリケーションを持っています。そして、私はそれに音声認識機能を実装したいと思います。ただ、このような :ねえ 『音声認識『彼/彼女が言うとき、ユーザが』 、私は、「2、』お茶「をちょっと」、「1」と呼ばれているいくつかのレコードを持っていると仮定すると、 apiはレコードの最初の入力を認識する必要があります。 "hey"、 "one"、 "two、" tea "は英語ではない単語です

    -1

    1答えて

    私はSphinx 4、TranscriberDemo.javaプログラムに取り組んでいます。から sphinx4-データ5prealpha-20160531.163451-9.jar sphinx4コア-5prealpha-20160531.163425-9.jar :私はhttps://sourceforge.net/projects/cmusphinx/files/sphinx4/5preal

    3

    1答えて

    startListening()を呼び出した後、AndroidでSpeechRecognizer.stopListening()を使用するときに問題が発生します。それは単に効果がないようです。 stopListening()が呼び出されていないかのように、オーディオは処理され続け、認識結果が返されます。 他に誰も同じような問題がありましたか?私は何か間違っていることがありますか? 考えられる原因:

    1

    1答えて

    pocketsphinxを使用して各セグメントの開始および終了タイム・スタンプを抽出しようとしています。以下のコードは、単語トークンを抽出するためのコードです。タイムスタンプにはどのようにアクセスできますか? 私はhttp://cmusphinx.sourceforge.net/doc/pocketsphinx/index.htmlここのドキュメントを見てみましたが、この方法に #!/usr/bi