google-speech-api

    0

    1答えて

    Google音声認識API v2でノードjs npm google-speech-api https://www.npmjs.com/package/google-speech-api を使って作業していますが、「中間結果」を取得する必要があります。 処理中のオーディオの途中結果を取得するにはどうすればよいですか。私はオンラインで検索しましたが、有益な情報を見つけてそれを動作させることはできません

    1

    2答えて

    の結果、私は 私は here利用できるインタラクティブなGETを使用してみました { "name": "376034185739864225" } を返され、次の curl -s -k -H "Content-Type: application/json" -H "Authorization: Bearer ${MY_ACCESS_TOKEN} " https://speech.g

    0

    1答えて

    Google Cloud Consoleでプロジェクトを作成し、このプロジェクトでGoogle Speech APIを有効にして認証情報を作成しました。 はまた、Googleが推奨transcribe.pyを使用 https://cloud.google.com/speech/docs/samples https://github.com/GoogleCloudPlatform/python-do

    2

    1答えて

    Google Speech APIドキュメントのNode JSの例はv1用であり、動作しません。 1チャンネルの16000HzのFLACを使用しても、空の応答が返されます。 私もこのパッケージを試しました - https://www.npmjs.com/package/google-speechしかし、私は正しいキーを使用していますが、私は動作するように認証を得ることができません。 v2 APIの

    0

    1答えて

    /node_modules /に手動で入れたモジュールを使用したいと思います。ファイルとインストールされた依存関係をnpmでコピー&ペーストするだけで、NWJS 0.16.0を使用しています。 var speech = require('speech')を私のapp.js(または他の場所)に入力すると、次のエラーが表示されます。Uncaught Error: Cannot find module

    4

    1答えて

    私は電話からオーディオを録音し、Google音声非ストリーミングAPIに送信します。私はCapture.captureAudio()を使って録音することができますが、音声符号化とサンプルレートは何であるか分かりません。なぜなら、それらは必要なのですからfor the api requestです。 オーディオのエンコードとサンプルレートを取得して、私のAPIリクエストで送ることができますか?

    1

    1答えて

    jsonの文字列をGoogleの音声APIにポストするとき、FL​​ACのオーディオファイルをbase64にエンコードするのが難しいです。私はいくつかの\ nは、Googleからの返信に気づいたが、base64で十分ではないか、おそらく私は完全にそのような文字列を構築し、それらをjson-yを満たすために十分に把握していない場合は、私はutf-8エンコーディングに傾いていますが、送信される情報をさ

    2

    1答えて

    PHPからGoogle音声APIを使用して音声からテキストを読み込もうとしていますが、次の場合に失敗します:リクエストには 'config'フィールドが含まれている必要があります。 これはコードです: <?php require '../lib/vendor/autoload.php'; $client = new Google_Client(); $client->useApplica

    1

    2答えて

    私はmp4ビデオクリップをFLACオーディオファイルに変換しようとしています。特定の言葉が言われました。 私はすべてが私はスピーチのAPIからエラーを取得していますことを除いて取り組んでいます { "error": { "code": 400, "message": "Sample rate in request does not match FLAC header.

    0

    1答えて

    Google音声APIを使用して音声をテキストに変換したい。 Google Speech APIは、16秒以下のオーディオでは問題なく機能しますが、16秒を超えるオーディオでは機能しません。 このAPIでどれくらいの長さの音声変換がサポートされているかについての考え方。 私はそれを購入すれば、より長い音声変換をサポートしていますか? いずれのポインタも高く評価されています。