2011-12-05 9 views
2

私はSpeechRecognitionEngineの機能を探求しています。私の最終目標は、WAVファイルとそのWAVファイルの転写を入力し、各単語の先頭(そして理想的には終わり)のWAVファイル内の位置を出力することです。SpeechRecognitionEngineの認識された単語の位置を特定する方法は?

私は正常にフレーズを認識するようにエンジンを得ることができますが、私は言葉は、起動時に認識など

あなたがしている場合は、仮定や認識されたいないときに、オーディオ位置を取得する方法を理解することはできませんこれが何であるか不思議ですが、それはlipsyncアニメーションワークフローを自動化することにあります。

お時間をいただきありがとうございます。

+0

あなたはどのようにしてアドバイスをしていただけますかエンジンにそのフレーズを認識させるには?私はそのようなことをしようとしていて、かなり詰まっています。あなたの助けを前もってありがとう:) – user990635

+0

'LoadGrammar'メソッドを使用して' SpeechRecognitionEngine'にロードした 'Grammar'オブジェクトを作成するために認識したい単語を含む文字列配列から作成した' GrammarBuilder'を使用しました。 – Rotem

答えて

2

正しい音声とテキストの位置合わせは、音声認識とは異なる特定のアルゴリズムを必要とするタスクです。 ASRエンジンでいくつかのアライメント機能をエミュレートできますが、うまくいくでしょう。アラインメントアルゴリズムの実装で

あなたはCMUSphinx音声認識ツールキットをチェックすることができます

http://cmusphinx.sourceforge.net/?s=long+audio+alignment

http://www.bluevincent.com/2011/02/speech-to-text-using-java.html

それとも、Nexiwave

http://nexiwave.com/index.php/applications/transcription-timestampingから1のような営利企業のサービスを試すことができますが

+0

ありがとう、私はスフィンクスを見ていきます。 – Rotem

関連する問題