1

私はPocketsphinxの音声機能をAndroidアプリケーションに統合する必要があるプロジェクトに取り組んでいます。実際には、私はフランス語で音素を再調整できるはずのPocketpshinxによって提供される音素認識機能を統合する必要があります。 ( "de"、 "re"、 "se"などのような)、子音( "m"、 "f"、 "g"などのような)、二重子音( " "kl"、 "ks"、 "gr"など)と母音( "a"、 "o"、 "e"など)を含む。 今、私は上記の音素を認識するためにPocketsphinxを統合しましたが、私は本当に悪い結果を出しています。例えば、 "o"を発音すると、 "SIL ff ei au"(文字 "f"と "e"を発音しなかったとしても)の認識結果が表示されることがあります。それは発音されません。初めに登場した文字は必ずしも同じではありません(時には私は "ll"、 "uu"などが得られます)。しかし、時には、最初に「I」の発音が「SIL aa SIL」と表示されますが、これは実際にはほとんど起こりません。 だから、皆さん、お手伝いをして問題の原因となる可能性のあることと、この問題を解決するための提案を教えてください。言語モデルと辞書は、私が関心を持っているこれらの文字でのみ作成する必要がありますか(文字の数は固定されているので)あるいは、私は音響モデルの適応を行うか、音響モデルを訓練する必要がありますか?Androidでフランス語の音素認識を使用したPocketsphinxの認識精度が低い

ありがとうございます!お使いのモデルでLeutrim

答えて

1

feat.paramsを見つけて、お好みに応じて-cmuinit値を変更し、また、誤警報を除去するため"-kws_threshold" 1E-40F の値。

+0

値を少し詳しく説明できますか? – Vaiden