テキスト入力をGoogleアシスタントに送信するにはどうすればよいですか？

現在、GoogleアシスタントSDKは音声入力を受け付けています。これは、私の質問がかなりシンプルであることを意味しています.Googleアシスタントと会話しますが、これは確かにとなります（Google Alloなど）。 googleはテキスト入力用のAPIを公開していますか？テキスト入力をGoogleアシスタントに送信するにはどうすればよいですか？

出典

2017-05-01 Arvind Badrinath

のv1alpha2バージョンではそれがまだできていないのですが、私は、[この議論を]参加することをお勧めサポートされるようになりました（https://plus.google.com/101852559274654726533/posts/ BskrFscRYdh）をGoogle+コミュニティに登録してください。 – proppy

これは、GoogleのアシスタントSDKサービス

出典

2017-12-29 19:49:15 vanshg

SDKのテキストオプションはまだありません。多分将来。

出典

2017-05-11 16:32:46

答えは_references_または_proof_でサポートする必要があります –

したがって、sdkがテキストを受け入れても、オーディオファイル入力を受け入れるようには見えません。オーディオファイルとして出力します。

python -m pushtotalk -i somefile.wav -o outputfile.wav

これは私が考えるようになったと私は、スクリプトを書いた：

echo $1 >> query.txt 
espeak -f query.txt -w audio_query.wav 
python -m pushtotalk -i audio_query.wav -o audio_response.wav &> pushtotalk.log 
pocketsphinx_continuous -infile audio_response.wav 2> pocketsphinx.log > response.txt 
cat response.txt 

rm response.txt query.txt audio_query.wav audio_response.wav pocketsphinx.log pushtotalk.log

これは単なるシェルスクリプトですが、これはおそらく、あまりにものpythonに変換することができます。これを使用するには、スクリプトをpushtotalk_script.shとして保存し、./pushtotalk_script.sh "how tall is mount kilamanjaro?を実行します。私はespeakを使ってテキストをwavファイルに変換しています。その後、アシスタントsdkを使用して応答を取得します。あなたはここでやめて、応答を演奏することができます。 Pocketsphinxは、CMUによって作成されたオーディオ転記者エンジンです。これらのツールのパッケージはapt-getを使って見つけることができますが、OSXの場合はpocketsphinxパッケージが機能せず、formulasをタップする必要があります。また、espeakを使用するpython moduleもあります。そして、pocketsphinxのためのレポがPythonモジュールとしてありますが、私は2つ以上のリンクをリンクすることはできません。

Googleのアシスタントでは、espeakの出力を理解するのに問題がないようです。しかし、Pocketsphinxは通常、テキストを転記するのに少し問題があります。しかし、それは簡単な応答のためにうまくいきます。質問と応答オーディオファイルの長さによっては、全体の処理に約5〜10秒かかります。

出典

2017-06-30 16:12:07

また、スクリプトに '' 'chmod''を使って実行する許可を与えることを忘れないでください。 –

これは控えめで、私はスピーチの合成を考えていました。 –

テキスト入力をGoogleアシスタントに送信するにはどうすればよいですか？

答えて

関連する問題