。
https://librosa.github.io/librosa/glossary.html「フレーム」の文言を確認してください。
通常、一連のサンプルはx軸の左から右に向かっていると考えられますが、librosaでは「y」と呼ばれています。
のは、私のサンプルは2とホップサイズ1のウィンドウで、あると仮定してみましょう:私は次のことを期待すると
[1,2,3,4,5]
:
array([[1, 2],
[2, 3],
[3, 4],
[4, 5]])
実際に私にされています何librosa:
array([[1, 2, 3, 4],
[2, 3, 4, 5]])
librosaがデータを表示/スローするのが好きなので便利です。
あなたは通常、あなたの頭の中に持っているだろうかで動作する簡単な方法は、np.array初心者については
mfccs = librosa.feature.mfcc(np.array([1,2,3,4,5]))
# The mfccs exists down the columns, not across each row!
array([[-353.18529412],
[ -9.92147635],
[ 1.39044844],
[ 19.76460942],
[ 25.52789074],
[ -18.65229483],
[ 17.41164986],
[ 32.40858638],
[ -13.52776281],
[ 8.38747316],
[ 23.82210792],
[ 16.50381765],
[ -23.39931177],
[ 40.04480991],
[ 7.76233177],
[ -2.54971281],
[ 4.81715362],
[ 36.80008536],
[ -9.8943455 ],
[ -0.57583487]])
mfccs.T
# Now mffcs[0] (the first row) refers to the first mfcc!
array([[-353.18529412, -9.92147635, 1.39044844, 19.76460942,
25.52789074, -18.65229483, 17.41164986, 32.40858638,
-13.52776281, 8.38747316, 23.82210792, 16.50381765,
-23.39931177, 40.04480991, 7.76233177, -2.54971281,
4.81715362, 36.80008536, -9.8943455 , -0.57583487]])
移調することです:これは何をするのでしょうか?透明なプラスチックに印刷されている行列(配列)を考え、次に左下をつかみ、ページを上にして左下を右上に移動します。
https://en.wikipedia.org/wiki/Mel-frequency_cepstrum - それでもまだ1D配列があるように思われます... – canada11
私はあなたに[Doc link]を送りますhttps://bmcfee.github.io/librosa/generated/librosa.feature.mfcc.html)しかし、今私は問題を見ています - それは**のリンクからです。あります。つまり、それらの例は時系列であり、いくつかの数のフィーチャなど、2次元を説明するものです。あなたのデータは時系列ではありませんか? – dwanderson
これは.wavファイルです – canada11