私はCMU Sphinxのための言語モデルを構築したいと思いますが、私のコーパスには1000以上の単語があり、オンラインツールを使用することはできません。言語モデルを構築するにはどのように使用しますか(cmuclmtkのスクリプト?)CMU Sphinxの大語彙言語モデルを作成するにはどうすればよいですか?
8
A
答えて
6
1
ない簡単な仕事をお読みください。言語モデルを生成することは、時間とリソースを大量に消費する作業です。
「良い」言語モデルを使用するには、言語モデルをトレーニングするために大規模または非常に大きなテキストコーパスが必要になります(ウォールストリートジャーナルテキストの数年のオーダーで考える)。
「良い」とは:言語モデルは、あなたがスフィンクスとHTK言語モデルツールキットのドキュメントを見なければならない新しい、以前は目に見えない入力データにトレーニングデータから
を一般化することができるようになります場合。
http://cmusphinx.sourceforge.net/wiki/tutoriallm
はまた、これらの二つのスレッドを確認してください。
Building openears compatible language model
あなたは大きなコーパスに基づいて、より一般的な言語モデルを取るとして、あなたの小さな言語モデルを補間することができそれは例えばバックオフ言語モデルです...しかしそれは簡単なことではありません。
は、以下を参照してください。Katz's back-off model
関連する問題
- 1. CMU Sphinxの音声言語モデルの作成方法は?
- 2. CMU Sphinxは〜200語を認識できるように設定できます
- 3. Sphinxの言語モデルを作成するには、コーパスをどれだけ大きくする必要がありますか?
- 4. 言語を使用してユーザープロファイルをモデル化するにはどうすればよいですか?どのように言語を格納するには?
- 5. Pythonで語彙を作成する
- 6. 言語複数ルールの別の言語をインストールするにはどうすればよいですか?
- 7. 「語彙タイプ」とは何ですか?プログラミング言語間
- 8. 多言語対応のASP.NET MVCアプリケーションを作成するにはどうすればよいですか?
- 9. ドメイン固有のクエリ言語を作成するにはどうすればよいですか?
- 10. Eager言語でレイジーリストを作成するにはどうすればよいですか?
- 11. アプリケーション言語を変更するにはどうすればよいですか?
- 12. 言語を学習するにはどうすればよいですか?
- 13. umbracoで、ペルシア語や他の言語のDatatimepickerを追加するにはどうすればよいですか?
- 14. 配列をC言語で関数globalで作成させるにはどうすればよいですか?
- 15. どのように言語バインディングを作成しますか?
- 16. 入力テキストボックスに英語以外の言語を入力するにはどうすればよいですか?
- 17. Android:多言語対応アプリケーションを作成するにはどうすればよいですか?
- 18. 多言語レポートを作成するにはどうすればよいですか?
- 19. .Net Coreで異なる言語のStringComparerを作成するにはどうすればいいですか?
- 20. 言語別にオープンソースプロジェクトを探すにはどうすればよいですか?
- 21. ペアのリストを作成する述語を作成するにはどうすればよいですか?
- 22. JSONに使用するSphinxコードブロック言語
- 23. 言語リクエストをバイパスするにはどうすればいいですか
- 24. ラベル言語を変更するにはどうすればいいですか?
- 25. gitk言語を変更するにはどうすればいいですか?
- 26. 大規模配列のグローバル宣言はどのようにC言語で動作するのですか?
- 27. Javascript以外の言語でDOMを操作するにはどうすればよいですか?
- 28. 記事や語彙を保存するにはどうすればいいですか
- 29. r言語で50GBの大容量CSVファイルを扱うにはどうすればいいですか?
- 30. Chromeのようにウェブページの言語を特定するにはどうすればよいですか?
それ文書では、「辞書を生成」を除いて、とても役に立ちました。ディストリビューションにその辞書を生成するスクリプトが付いていますか? – joeforker
Subversionからチェックアウトできる発音ツールhttp://cmusphinx.svn.sourceforge.net/viewvc/cmusphinx/trunk/logios/Tools/MakeDict/ http://code.google.com/のような外部のg2pパッケージがあります。 com/p/phonetisaurus /またはsequitur-g2pを使用することもできます。 –
pocketsphinxには、モデルのすぐ隣のen_USディレクトリに辞書があります。私はそれを使ってみるつもりです。 – joeforker