2011-12-07 12 views
2

自動音声認識は、自動音声認識ではありません。これは、音声信号の2つの部分を比較し、これらの2つの音声信号が何パーセントに一致するかを戻すことです。自動音声認識のためのオープンソース?

この技術は、通常、そのようなシナリオのように使用されます。

  1. 発音学習は、例えば、単語「こんにちは」の標準発音信号があり、英語を勉強している学生のために、彼らは「こんにちは、自分の発音しますASMの技術を使って、学生がどのように類似しているか、あるいはどの程度正確に発音しているかを比較する必要があります。だから我々は、これら2つの1次元オーディオ信号を比較するアルゴリズムの種類を理解する必要があります。

2.単語は1単語から文まで拡張できます。どのようにこれらのオーディオ信号を一致させるには?

ここで、ASMのオープンソースまたは商用ソリューションを探してみましょう。

このような実際の要件に対するその他の解決策はありますか?

ありがとうございます!

答えて

2

テンプレートとの比較では、誤って話されたことを実際には示唆しないため、何の効果もありません。良い発音学習フレームワークはテンプレートと一致しませんが、適切かつ間違った発音を表す音響モデルがあります。これにより、学習者が行う音声の誤りを検出することができます。あなたは

にSRI EduSpeakTMシステムを読むことができます:認識と発音得点 http://www.speech.sri.com/people/hef/papers/EduSpeak.ps

このアルゴリズムの実装ではIPhoneにあなたが

http://ottercall.com

を確認することができます