google-speech-api

    1

    1答えて

    私は現在、ユーザーが製品(Raspberry Pi 3)と話すことができるいくつかの機能を作成する必要があるプロジェクトに取り組んでいます。話をすると、ユーザーは"製品の開始"のような1つまたは2つの単語をPiに言うことができるはずで、それがアクティブになり、そのことが起こります。 これで、Piは、単語の特定の組み合わせがユーザーによって言われたときに、引き続き聞くことができ、アクティブになる必要

    0

    1答えて

    ベータ版が期限切れになると、Googleの新しい音声APIに移行しようとしています。しかし、新しいものは動作していないようです。で開始するには、これはインストール失敗しているようだ:それは他のエラーそれにもかかわらず ImportError: cannot import name IncompleteRead の全体の束と一緒に次のエラーが生成さ pip install --upgrade g

    1

    1答えて

    Google Speech APIが自分の目的のために十分正確であるかどうかを確認したい。テストしたいオーディオファイルがありますが、メインページのデモではマイクからのみ録音できます。最初にAPIを覚えることなく、音声ファイルを使ってGoogleの音声処理をテストする方法はありますか?

    2

    1答えて

    私はRaspberry PiでGoogle python音声認識を使用しています。しかし、それは絶えず聞いているので、私はそれが必要なときだけ聞くように目覚めの言葉を持つことを好むでしょう。 現在、無音(または周囲の背景ノイズが何であれ)になるまでリッスンし、音声クリップをテキスト認識のためのAPIに送信します。聞いている時間の長さを短縮する方法はありますか?こうすることで、一度に1つの単語だけを

    0

    1答えて

    私はwebkitSpeechRecognitionを使用するJavaScriptアプリケーションを開発しています。私のコードでは何が必要なのですか?私はinterimResultをtrueに設定しています。そのため、アプリケーションが話し言葉に一致するものを見つけたときにユーザーが見ることができますが、自分自身が最終結果を何か他のものに使用したいのです。私が持っている <script type="

    1

    1答えて

    Google音声APIを使用してテキストをテキストに変換する簡単なWebアプリケーションを作成しようとしています。 Google Speech API認証などを正しく設定して、Googleのノードサンプルを管理するようにしました。私はこれをしようとすると、私が取得 const express = require("express"); const fs = require("fs"); con

    3

    1答えて

    Google Cloud Platform Machine LearningのSpeech APIを使用して音声言語を自動的に検出するオプションはありますか? https://cloud.google.com/speech/docs/languagesは、サポートされる言語のリストを示します。しかし、ユーザは、このパラメータを手動で設定して音声対テキストを実行する必要があります。私はこれを自動的に

    3

    2答えて

    2つ以上の音声からテキストへのAPIを使用して音声を書き写そうとしたことはありますか?あなたはタイムスタンプを使って単語を突き合わせて、最も高い信頼度で単語を選ぶことができます。誰かがこれをしたならば、それは転写の正確さを大幅に改善しましたか?その価値はありますか?

    0

    1答えて

    ラップトップマイクからGoogle音声認識エンジンにオーディオデータをストリームするコードがありますが、他のソースからオーディオをストリーミングする必要があります。そのソースから、私は生データのバッファを取得することができ、このバッファは私がgoogleにストリームしたいものです。誰かが私を助けたり、役に立つ助言をしたりすることができますか? 私は自分でこれを検索して解決しようとしますが、私は見つ