私はSpeechRecognitionEngine
の機能を探求しています。私の最終目標は、WAVファイルとそのWAVファイルの転写を入力し、各単語の先頭(そして理想的には終わり)のWAVファイル内の位置を出力することです。SpeechRecognitionEngineの認識された単語の位置を特定する方法は?
私は正常にフレーズを認識するようにエンジンを得ることができますが、私は言葉は、起動時に認識など
あなたがしている場合は、仮定や認識されたいないときに、オーディオ位置を取得する方法を理解することはできませんこれが何であるか不思議ですが、それはlipsyncアニメーションワークフローを自動化することにあります。
お時間をいただきありがとうございます。
あなたはどのようにしてアドバイスをしていただけますかエンジンにそのフレーズを認識させるには?私はそのようなことをしようとしていて、かなり詰まっています。あなたの助けを前もってありがとう:) – user990635
'LoadGrammar'メソッドを使用して' SpeechRecognitionEngine'にロードした 'Grammar'オブジェクトを作成するために認識したい単語を含む文字列配列から作成した' GrammarBuilder'を使用しました。 – Rotem