gRPC経由の音声認識には、Assistant SDKのpythonライブラリを使用しています。私は、音声を認識して\googlesamples\assistant\__main__.py
からメソッドresp.result.spoken_request_text
を呼び出して、文字列として返され、私はそれが可能であれば私が知りたいのですが\googlesamples\assistant\__main__.py
Googleアシスタントから音声ストリームではなく文字列として回答を受け取る方法
からも方法resp.audio_out.audio_data
と助手APIからのオーディオストリームとして答えを持っています文字列としてのサービスからの答えを持っている(サービス定義で利用可能か、それを含めることができることを期待している)。
ありがとうございます。
ご返信ありがとうございます。私は返されたオーディオストリームをアシスタントにフィードしてテキストとしてのクエリ翻訳を得ることを考えました...しかし、あなたが言うように、それは愚かになり始めます。ただ効率的ではありません。音声ストリームを処理するためにGoogle Could PlatformのSpeech APIと通信するためにPythonでgRPCを使用しましたか? – Towerss
これは、別の質問として最もよく尋ねられます。 – Prisoner