2016-07-20 6 views

答えて

-2

クラウドスピーチAPIは、RESTまたはgRPCリクエストを生成できる任意のアプリまたは任意のIoTデバイスと統合できます。これは、コマンドを発行したり、ディクテーションを転写したり、スピーカーがマイクに近く、録音が高品質である(例えば、16kHzのデジタル録音)場合に特に有効です。

4

クラウドスピーチAPIに最適なものはどれですか?

サポートされているものが最適に動作しなければならない。

  • LINEAR16非圧縮16ビットのリトルエンディアンサンプルを締結しました。これは で、speech.asyncrecognizeで使用できる唯一のエンコーディングです。
  • FLACこれはspeech.syncrecognizeおよび の推奨されるエンコードであり、可逆圧縮を使用するためStreamingRecognizeです。したがって、損失の多いコーデックによって認識精度が損なわれることはありません。
  • MULAW G.711 PCMU/mu-lawを使用して14ビットオーディオサンプルをコンパクトにする8ビットのサンプル。
  • AMR適応マルチレート狭帯域コーデック。 sampleRateは8000 Hzでなければなりません。
  • AMR_WB適応マルチレートワイドバンドコーデック。 sampleRateは、16000 Hzでなければなりません。

https://cloud.google.com/speech/reference/rest/v1beta1/RecognitionConfig#AudioEncoding

関連する問題