2017-05-01 2 views
5

現在、GoogleアシスタントSDKは音声入力を受け付けています。これは、私の質問がかなりシンプルであることを意味しています.Googleアシスタントと会話しますが、これは確かにとなります(Google Alloなど)。 googleはテキスト入力用のAPIを公開していますか?テキスト入力をGoogleアシスタントに送信するにはどうすればよいですか?

+1

v1alpha2バージョンではそれがまだできていないのですが、私は、[この議論を]参加することをお勧めサポートされるようになりました(https://plus.google.com/101852559274654726533/posts/ BskrFscRYdh)をGoogle+コミュニティに登録してください。 – proppy

答えて

2

これは、GoogleのアシスタントSDKサービス

0

SDKのテキストオプションはまだありません。多分将来。

+0

答えは_references_または_proof_でサポートする必要があります –

1

したがって、sdkがテキストを受け入れても、オーディオファイル入力を受け入れるようには見えません。オーディオファイルとして出力します。

python -m pushtotalk -i somefile.wav -o outputfile.wav 

これは私が考えるようになったと私は、スクリプトを書いた:

echo $1 >> query.txt 
espeak -f query.txt -w audio_query.wav 
python -m pushtotalk -i audio_query.wav -o audio_response.wav &> pushtotalk.log 
pocketsphinx_continuous -infile audio_response.wav 2> pocketsphinx.log > response.txt 
cat response.txt 

rm response.txt query.txt audio_query.wav audio_response.wav pocketsphinx.log pushtotalk.log 

これは単なるシェルスクリプトですが、これはおそらく、あまりにものpythonに変換することができます。これを使用するには、スクリプトをpushtotalk_script.shとして保存し、./pushtotalk_script.sh "how tall is mount kilamanjaro?を実行します。私はespeakを使ってテキストをwavファイルに変換しています。その後、アシスタントsdkを使用して応答を取得します。あなたはここでやめて、応答を演奏することができます。 Pocketsphinxは、CMUによって作成されたオーディオ転記者エンジンです。これらのツールのパッケージはapt-getを使って見つけることができますが、OSXの場合はpocketsphinxパッケージが機能せず、formulasをタップする必要があります。また、espeakを使用するpython moduleもあります。そして、pocketsphinxのためのレポがPythonモジュールとしてありますが、私は2つ以上のリンクをリンクすることはできません。

Googleのアシスタントでは、espeakの出力を理解するのに問題がないようです。しかし、Pocketsphinxは通常、テキストを転記するのに少し問題があります。しかし、それは簡単な応答のためにうまくいきます。質問と応答オーディオファイルの長さによっては、全体の処理に約5〜10秒かかります。

+0

また、スクリプトに '' 'chmod''を使って実行する許可を与えることを忘れないでください。 –

+0

これは控えめで、私はスピーチの合成を考えていました。 –

関連する問題