2017-05-22 12 views
2

gRPC経由の音声認識には、Assistant SDKのpythonライブラリを使用しています。私は、音声を認識して\googlesamples\assistant\__main__.pyからメソッドresp.result.spoken_request_textを呼び出して、文字列として返され、私はそれが可能であれば私が知りたいのですが\googlesamples\assistant\__main__.pyGoogleアシスタントから音声ストリームではなく文字列として回答を受け取る方法

からも方法resp.audio_out.audio_dataと助手APIからのオーディオストリームとして答えを持っています文字列としてのサービスからの答えを持っている(サービス定義で利用可能か、それを含めることができることを期待している)。

ありがとうございます。

答えて

5

現在(アシスタントSDKデベロッパー向けプレビュー1)、これを行う方法はありません。おそらく音声ストリームをSpeech-to-Textシステムに送り込むことができますが、それは実際には愚かになり始めます。

Google I/Oでこのテーマのエンジニアと話したところ、彼らはこれをやるにあたり技術的な合併症があることを示しましたが、ユースケースを理解しています。彼らは人々がその機能を望んでいることを知るために、このような質問を見る必要があります。

今後のデベロッパー向けプレビューにはうれしく思います。

+0

ご返信ありがとうございます。私は返されたオーディオストリームをアシスタントにフィードしてテキストとしてのクエリ翻訳を得ることを考えました...しかし、あなたが言うように、それは愚かになり始めます。ただ効率的ではありません。音声ストリームを処理するためにGoogle Could PlatformのSpeech APIと通信するためにPythonでgRPCを使用しましたか? – Towerss

+0

これは、別の質問として最もよく尋ねられます。 – Prisoner

関連する問題