2017-02-18 26 views
1

Mel Frequency Cepstral Coefficient(MFCC)とDynamic Time Warping(DTW)を使用して音声認識モジュールを実装しようとしています。DTWにMFCC係数を適用する方法

信号(x(n))を10msのオーバーラップを持つ25msのフレームに分割し、各フレームのMFCCパラメータを見つけます。 私の主な疑問は、このシナリオでどのようにDTWを実行するのかです。 MフレームとN(13)MFCC係数があるとします。

私はM×Nの行列を持っています。 今、DTWをどのように計算する必要がありますか?

答えて

2

MxNの行列は、1DベクトルMxNの長さで表すことができます。

ので、あなたが

​​

秒、その後、

p1[M*N], len=i, 'silence-HHHEEEEELLLLLOOOOOOOO-silence' sound; 

をPATTERN1ているマンハッタンDTW、ユークリッド、ブレイ・カーティスなど距離の計算は、あなたが出力2D行列を取得し、その後、あるでしょう最小ウェイトのパス。

関連する問題