Google Cloud Consoleでプロジェクトを作成し、このプロジェクトでGoogle Speech APIを有効にして認証情報を作成しました。 はまた、Googleが推奨transcribe.pyを使用Google音声認識APIが最初に返されるのは2〜3秒間の音声テキストです。
https://cloud.google.com/speech/docs/samples
https://github.com/GoogleCloudPlatform/python-docs-samples/tree/master/speech
私は、Googleによって生成されたAPIキーでそれを使用することができます成功した音声ファイル(30秒を変換するためのコンソール可能性)をテキストに変換しますが、完全には入力しません。私のアカウントは今では無料試用版なので、私のアカウントタイプ(無料試用版)のためかどうかは疑問です。
Googleからの回答は のようです{"結果":[{"代替":[{"信頼":0.89569235、 "トランスクリプト": "私は森にピクニックをしています。 0:0:オーディオ:pcm_s16le([1] [0] [0] [0])オーディオファイルはwavファイルでフォーマットされています(ffprobeで印刷されます) ストリーム#0:0:/0x0001に)、16000 Hzで、1つのチャンネル、S16、256キロバイト/ sの
オーディオファイルをGoogleドライブにアップロードされた、リンクはこちら https://drive.google.com/file/d/0B3koIsnLksOLQXhvQ1ljS0dDXzg/view?usp=sharing
であるA nybodyは上記のプロセス/ステップに何が間違っているか知っていますか?これはバグGoogleの音声認識APIですか?クラウドスピーチAPIサービスでGoogleのAPI Explorerを使用して