1
Mel Frequency Cepstral Coefficient(MFCC)とDynamic Time Warping(DTW)を使用して音声認識モジュールを実装しようとしています。DTWにMFCC係数を適用する方法
信号(x(n))を10msのオーバーラップを持つ25msのフレームに分割し、各フレームのMFCCパラメータを見つけます。 私の主な疑問は、このシナリオでどのようにDTWを実行するのかです。 MフレームとN(13)MFCC係数があるとします。
私はM×Nの行列を持っています。 今、DTWをどのように計算する必要がありますか?