Cloud Speech APIではどのような種類のオーディオがサポートされていますか？

多くのオーディオフォーマット（mp3、m4aなど）、ソース（口述、コマンド、電話、ミーティングなど）とデバイス（電話、PC、IoTデバイスなど）があります。クラウドスピーチAPIで最もうまくいくのはどれですか？Cloud Speech APIではどのような種類のオーディオがサポートされていますか？

-2

クラウドスピーチAPIは、RESTまたはgRPCリクエストを生成できる任意のアプリまたは任意のIoTデバイスと統合できます。これは、コマンドを発行したり、ディクテーションを転写したり、スピーカーがマイクに近く、録音が高品質である（例えば、16kHzのデジタル録音）場合に特に有効です。

2016-07-20 16:04:55

クラウドスピーチAPIに最適なものはどれですか？

サポートされているものが最適に動作しなければならない。

LINEAR16非圧縮16ビットのリトルエンディアンサンプルを締結しました。これはで、speech.asyncrecognizeで使用できる唯一のエンコーディングです。
FLACこれはspeech.syncrecognizeおよびの推奨されるエンコードであり、可逆圧縮を使用するためStreamingRecognizeです。したがって、損失の多いコーデックによって認識精度が損なわれることはありません。
MULAW G.711 PCMU/mu-lawを使用して14ビットオーディオサンプルをコンパクトにする8ビットのサンプル。
AMR適応マルチレート狭帯域コーデック。 sampleRateは8000 Hzでなければなりません。
AMR_WB適応マルチレートワイドバンドコーデック。 sampleRateは、16000 Hzでなければなりません。

2016-10-15 18:10:20

答えて