自動音声認識は、自動音声認識ではありません。これは、音声信号の2つの部分を比較し、これらの2つの音声信号が何パーセントに一致するかを戻すことです。自動音声認識のためのオープンソース?
この技術は、通常、そのようなシナリオのように使用されます。
- 発音学習は、例えば、単語「こんにちは」の標準発音信号があり、英語を勉強している学生のために、彼らは「こんにちは、自分の発音しますASMの技術を使って、学生がどのように類似しているか、あるいはどの程度正確に発音しているかを比較する必要があります。だから我々は、これら2つの1次元オーディオ信号を比較するアルゴリズムの種類を理解する必要があります。
2.単語は1単語から文まで拡張できます。どのようにこれらのオーディオ信号を一致させるには?
ここで、ASMのオープンソースまたは商用ソリューションを探してみましょう。
このような実際の要件に対するその他の解決策はありますか?
ありがとうございます!