1
私には概念上の問題があります。話者認識と音声認識に使用されるMFCC機能の違いは?
私はMFCCが何であるか知っています。しかし、話者認識のためのmfcc特徴ベクトルと音声認識のためのmfcc特徴ベクトルの違い、すなわち、mfcc特徴のどの部分が2つの間の差異要因として使用されるのかを見つけることができないのですか? また、mfccベクトルに基づいて2つのスピーカーを区別する方法もありますか?
私には概念上の問題があります。話者認識と音声認識に使用されるMFCC機能の違いは?
私はMFCCが何であるか知っています。しかし、話者認識のためのmfcc特徴ベクトルと音声認識のためのmfcc特徴ベクトルの違い、すなわち、mfcc特徴のどの部分が2つの間の差異要因として使用されるのかを見つけることができないのですか? また、mfccベクトルに基づいて2つのスピーカーを区別する方法もありますか?
機能は非常に似ています。違いは、係数の数、ウィンドウサイズ、正規化...などです。this threadを見てください。
mfcc機能を使用すると、複数の方法でスピーカーを区別できます。最も有名な技術の二つがある: