2017-10-27 14 views
0

私はこの同じ問題で約3日を費やしました。基本的に、私はgs://architecture-transcript-1/architecture.flacにある私のオーディオファイルの大まかな転写を行うためにGoogleの雲の音声APIを使用しようとしています ファイルは以前はm4aでしたが、 flacファイルであり、サンプルレートは44100hzで、1時間18分続きます。端末でPythonを使用したクラウド非同期音声認識エラー

私はPython 3.5を実行していて、コマンドプロンプトを使用しています。チュートリアルは、私が使用しています:https://github.com/GoogleCloudPlatform/python-docs-samples/blob/master/speech/cloud-client/README.rst

私はpipとvitual envをインストールし、依存関係をインストールし、単にコマンドを使ってチュートリアルのすべてのステップを完了しました " transcribe_async.py "コマンドプロンプトで

が、これは次のようになります。以前はこれを行うに

:\> virtualenv env 
:\> virtualenv env/bin/activate 
:\> cd C:\python-docs-samples-master\speech\cloud-client 
C:\python-docs-samples-master\speech\cloud-client> pip install -r requirements.txt 
C:\python-docs-samples-master\speech\cloud-client> python transcribe_async.py gs://architecture-transcript-1/architecture.flac 

、私は私のエンコードとファイル形式が一致したことを確認するtranscribe_async.pyファイルに行ってきました。それを実行した後
、それが完了...そして、この最後のエラーを取得するための操作を待っていると言う:

File "transcribe_async.py", line 96, in <module> 
transcribe_gcs(args.path) 
File "transcribe_async.py", line 79, in transcribe_gcs 
response = operation.result(timeout=90) 
File "C:\Users\George\Anaconda3\lib\site-packages\google\gax\__init__.py", 
line 595, in result 
if not self._poll(timeout).HasField('response'): 
File "C:\Users\George\Anaconda3\lib\site-packages\google\gax\__init__.py", 
line 705, in _poll 
return retryable_done_check() 
File "C:\Users\George\Anaconda3\lib\site-packages\google\gax\retry.py", line 
143, in inner 
raise exc 
google.gax.errors.RetryError: RetryError(Retry total timeout exceeded with 
exception, caused by Deadline Exceeded) 

主なエラーがあると思われる:「google.gax.errors.RetryError:RetryError(再試行の合計タイムアウト超過によるタイムアウトを超過したためにタイムアウトを超過しました)」

Googleのオーディオコードを使ってオーディオファイルを試しています。

私はPythonを使用する方法を学んでいます(現在は1年目です)。これは初心者の間違いかもしれませんが、私はしばらくこの問題に苦労しています。

P.S現在、私のファイルは公開されていますので、直接試してみると役立ちます。

ありがとうございました。

答えて

0

私はあなたが転記に使用しているオーディオファイルの長さを知りません。私はあなたが「transcribe_async.py」にライン79で、今のところ大規模な番号を使用するように

response = operation.result(timeout=1000) 

を提案し、それが助けかどうかを確認します。あなたはGoogleのCloud SDKを使用して検討するかもしれない

+0

うん、私は4200でそれを設定し、最終的にはそれが仕事を得ることができました。私は彼らがファイルのサイズや期間に基づいてタイムアウトのガイドラインを掲示してもらいたいと思っていましたが、それはそのトリックをするようでした。ありがとう。 – Jonesn11

0

は、現在ベータ版では、この目的のためのコマンドがあり

gcloud beta ml speech recognize gs://architecture-transcript-1/architecture.flac \ 
    --sample-rate 44100 --language en-US --encoding=FLAC