2017-07-27 7 views
1

私は現在、ユーザーが製品(Raspberry Pi 3)と話すことができるいくつかの機能を作成する必要があるプロジェクトに取り組んでいます。話をすると、ユーザーは"製品の開始"のような1つまたは2つの単語をPiに言うことができるはずで、それがアクティブになり、そのことが起こります。連続音声認識

これで、Piは、単語の特定の組み合わせがユーザーによって言われたときに、引き続き聞くことができ、アクティブになる必要があります。

私はSpeechRecognitionライブラリを実装しましたが、この種の作品は残念ですが、悲しいことに、Piが聞く場所は最大10秒です。

私のユースケースで助けになるライブラリがあれば、何か助けてもらえますか?

答えて

1

はあなたが悲しげPiは聞くだろう〜10秒の最大がある

によって何を意味良く説明することができます。

CMUSphinxを使った私の経験から(私のポケットフィックスの使用例をお勧めします)、問題なく連続して動作します。 問題がPi側かSpeechRecognition側にあるかどうかを知りましたか?

SpeehRecognitionの背後にあるエンジンは何ですか? CMUSphinx、Google、Microsoft? GoogleとMicrosoftの場合、10秒間の制限があるのが普通です。ただし、CMUSphinxを使用すると、このようなことは起こりません。しかし、ASRシステムをセットアップする方法を少し学ぶ必要があるかもしれません。

+0

ご回答ありがとうございます。 〜10秒で、私はPythonスクリプトを実行した瞬間から、私のRaspberry Piは約10秒間聴きます。これはPi自体の問題ではありませんが、これはSpeechRecognition側にあります。私は10秒が認識できる最大のものであることを発見しました。あなたはPocketsphinxに言及しました、私はそれについて少し読んでいましたが、私はそれが継続的に聞くことができませんでした。マイクから直接認識できるかどうか分かりますか?または、それはWAVファイルからのみ認識しますか?また、万が一Pocketsphinxのチュートリアルはありますか? –