2017-11-19 19 views
-2

録音した音声ファイルをテキストに変換したい。私は非同期音声認識を使用してGoogle Speech APIを使用しようとしています。Google Speech APIの使い方Androidでの非同期音声認識

私は進め方について少し質問があります。

1。私はオーディオテキストを変換したいと思うし、リアルタイムでそれをしたくない。だから私は非同期recogonitionを使用する必要がありますか?
Google sample projectSpeechGrpcを使用します。アンドロイドで使用する必要がありますか?アシクロナス音声認識?または私は使用することができますSpeechClient認証後どのように?

2。SpeechGrpc(com.google.cloud.speech.v1.SpeechGrpc)私のパッケージには存在しません! (com.google.cloud.speech.v1)。私はここからそれをインストールする必要がありますか? grpc.io

3。 Google Cloud Platform Console APIキーを使用してSpeech API(ManagedChannelオブジェクト)を認証しましたが、これを使用する方法と非同期音声認識に使用する機能は理解できません。

// Authentication 

try { 
       GoogleCredentials creds = GoogleCredentials.fromStream(stream); 
       creds = creds.createScoped(SCOPE); 
       mChannel = ManagedChannelBuilder.forAddress(HOSTNAME, PORT) 
         .intercept(new ClientAuthInterceptor(creds, Executors.newSingleThreadExecutor())) 
         .build(); 
      }catch (IOException e){ 
       Log.e(TAG, "Failed to create channel.", e); 
      } 

認証後にどうすればよいですか。アンドロイドの非同期音声認識に関するコードリファレンスやドキュメントはありますか?

答えて

-1

はい、非同期要求を使用する必要があります。

Googleクラウドストレージにファイルをアップロードするには、1分以上かかる場合があります。 https://cloud.google.com/speech/quotas "* 1分を超える長さの音声は、uriフィールドを使用してGoogle Cloud Storageのオーディオファイルを参照する必要があります。

私はサンプルプロジェクトの実装を使用していますが、かなりうまく動作しますが、SpeechGrpcを使用してリクエストのlongRunningRecognizeを使用することをお勧めします。

SpeechGrpcを使用している場合は、ファイルストリームを読み取り、次にGoogleCredentialsを使用して認証することができます。