私は現在、ユーザーが製品(Raspberry Pi 3)と話すことができるいくつかの機能を作成する必要があるプロジェクトに取り組んでいます。話をすると、ユーザーは"製品の開始"のような1つまたは2つの単語をPiに言うことができるはずで、それがアクティブになり、そのことが起こります。連続音声認識
これで、Piは、単語の特定の組み合わせがユーザーによって言われたときに、引き続き聞くことができ、アクティブになる必要があります。
私はSpeechRecognitionライブラリを実装しましたが、この種の作品は残念ですが、悲しいことに、Piが聞く場所は最大10秒です。
私のユースケースで助けになるライブラリがあれば、何か助けてもらえますか?
ご回答ありがとうございます。 〜10秒で、私はPythonスクリプトを実行した瞬間から、私のRaspberry Piは約10秒間聴きます。これはPi自体の問題ではありませんが、これはSpeechRecognition側にあります。私は10秒が認識できる最大のものであることを発見しました。あなたはPocketsphinxに言及しました、私はそれについて少し読んでいましたが、私はそれが継続的に聞くことができませんでした。マイクから直接認識できるかどうか分かりますか?または、それはWAVファイルからのみ認識しますか?また、万が一Pocketsphinxのチュートリアルはありますか? –