2016-07-01 9 views
1

22 mins (1320 secs)のオーディオファイルが与えられると、Librosaは data = librosa.feature.mfcc(y=None, sr=22050, S=None, n_mfcc=20, **kwargs)Librosa:MFCC特徴量算出

data.shape (20,56829) によりMFCC特徴を抽出は20のMFCC特徴のnumpyの配列を返します56829フレーム。

私の質問は、それが56829.を計算する方法である。このフレームを達成するための任意の計算はありますか?各フレームのウィンドウサイズはどのくらいですか?

答えて

2

あなたはk番目のフレームは、サンプルkを中心とするように

mfcc = librosa.feature.mfcc(y=y, sr=sr, hop_length=hop_length, n_mfcc=13) 

librosaは、中心フレームを使用ホップ長さを指定することができます* hop_length

私はデフォルトのホップ値は、あなたのデータと、512であることを考えます(1320 * 22050)/ 56829 = 512,16