2017-06-02 12 views
2

私はpythonで音声認識API「チーン」は非常に遅いです

import speech_recognition as sr 

# obtain audio from the microphone 
r = sr.Recognizer() 
with sr.Microphone() as source: 
r.adjust_for_ambient_noise(source) 
print("Say something!") 
audio = r.listen(source) 
print(type(audio)) 


BING_KEY = 'KEY' # Microsoft Bing Voice Recognition API keys 32-character lowercase hexadecimal strings 
try: 
    print(type(r.recognize_bing(audio, key=BING_KEY))) 
except sr.UnknownValueError: 
    print("Microsoft Bing Voice Recognition could not understand audio") 
except sr.RequestError as e: 
    print("Could not request results from Microsoft Bing Voice Recognition service; {0}".format(e)) 

を音声認識を使用するには、次のコードを使用しています。しかし、それは非常に遅いです、それも20秒遅れ!それは非常に遅いです、あなたはPythonで任意のリアルタイムの音声認識APIをお勧めできますか?またはそのコードの推奨される変更

答えて

2

私はBing Speech APIを使用しますが、私はあなたのようなクライアントライブラリを使用しません。私はREST APIを使用します。私はPyAudioを使用してオーディオをライブで取得し、ノイズレベルが上がったことを検出すると、サウンドをwavファイルに記録し始め、終了したらエンドポイントにオーディオデータを送信してAPIドキュメントが表示されます。それは、私にはすばやく、最大で3秒の応答を与えますが、ちょっとWi-Fi速度に依存します。私の方法はあなたよりも複雑ですが、それはそれに値するものです。

hereは、ドキュメントへのリンクです。彼らは例ではC#を使用していますが、それはオンラインAPIなので、ヘッダーに正しい情報を送ってもそれはうまくいくはずです。

+0

私はPythonを使用しています。したがって、PythonでREST APIのコードサンプルがある場合は、非常に感謝します –