-1

最近、私はキーワードスポッティングシステムを実装するプロジェクトに注力しました。以前は音声認識にHTKを使用しました。今、HTKを使ってキーワードスポッターを実装することは可能でしょうか?キーワードスポッティングHTK

答えて

0

音声認識とキーワードスポッティングは、かなり関連した問題です。 2つのソリューションのHTK 1については

が可能です:

  1. は、あなたが検索したい単語のリスト、ゴミと沈黙ユニットと単語ループ文法を構築します。詳細については、HTUbookのHBuildを参照してください。

  2. 従来の音声デコードでは、単語の格子(HTKでは.slf)が生成されます。次に例lattice-toolのために、とのコンセンサスネットワーク(ソーセージ)にそれを変換し、私はHBuildを読んで、私の目的に当接し、何も見つけなかった

+0

ある閾値以上のスコアを持っている単語を検索します。そこで、ワードループを作成する方法についてウェブを検索しました。しかし、今私は何をすべきかわからない。 –

+0

キーワードリストが大きすぎない場合は、[here](http://www.ee.columbia.edu/ln/LabROSA/doc/HTKBook21/node133.html)の説明に従ってネットワークを構築できます。また、ネットワークのガベージ・ユニットとサイレンス・ユニットを追加する必要があります。 HTKを必須としない場合は、[KWS from Sphinx](http://cmusphinx.sourceforge.net/wiki/tutorialandroid)を使う方が簡単かもしれません。 –

関連する問題