2016-10-27 11 views
0

言語モデリングにはHTKの使い方が混乱しています。 私はトレーニングやテストの後How to do HTKを使用した言語モデリング

http://www.voxforge.org/home/dev/acousticmodels/linux/create/htkjulius/tutorial

Voxforgeサイトからチュートリアルの例を、次に私の周り78%の精度を得ました。私は母国語のためにこれをしました。今では、言語モデリングにHTKを使用する必要があります。

同じことを行うためのチュートリアルはありますか?私を助けてください。私が正しくあなたの質問を理解していれば speech_tri

答えて

1

おかげで、あなたは「nグラム言語モデル」のアプローチに「文法」から変更しようとしています。これらの2つの方法は、認識装置が返す応答において許容される単語の組み合わせを指定する別の方法です。 Voxforgeのプロセスに従えば、おそらく文法が整うでしょう。

言語モデルは、一緒に現れる単語の確率を定義するテキストのコーパスの分析に由来します。使用されるテキストコーパスは非常に特殊化することができます。 SRILM(http://www.speech.sri.com/projects/srilm/)やMITLM(https://github.com/mitlm/mitlm)などのコーパスを読み込んでモデルを作成するなどの分析ツールがいくつかあります。

母国語の単語を使用しているため、分析するために固有のコーパスが必要です。テストコーパスを取得する1つの方法は、既存の文法から人工的に多数のセンテンスを生成し、それをコーパスとして使用することです。次に、新しい言語モデルを使用して、文法の代わりに認識プログラムを指し、最良のものを願うだけです。