DTWにMFCC係数を適用する方法

Mel Frequency Cepstral Coefficient（MFCC）とDynamic Time Warping（DTW）を使用して音声認識モジュールを実装しようとしています。DTWにMFCC係数を適用する方法

信号（x（n））を10msのオーバーラップを持つ25msのフレームに分割し、各フレームのMFCCパラメータを見つけます。私の主な疑問は、このシナリオでどのようにDTWを実行するのかです。 MフレームとN（13）MFCC係数があるとします。

私はM×Nの行列を持っています。今、DTWをどのように計算する必要がありますか？

MxNの行列は、1DベクトルMxNの長さで表すことができます。

ので、あなたが

秒、その後、

p1[M*N], len=i, 'silence-HHHEEEEELLLLLOOOOOOOO-silence' sound;

をPATTERN1ているマンハッタンDTW、ユークリッド、ブレイ・カーティスなど距離の計算は、あなたが出力2D行列を取得し、その後、あるでしょう最小ウェイトのパス。

2017-02-25 23:09:57 BIOjack

答えて