mfcc

0熱

1答えて

以下は、私がメル三角フィルターバンクを作成しようとしているコードです。私は300から8000 Hzの範囲から始め、周波数をmelsに変換してから、周波数に戻してfft_bin番号を取得します。 clear all; g=[300 8000]; % low freqncy and fs/2 for the highest frequency freq2mel=1125*log(1+(g/7

0熱

2答えて

floatの配列をlibmfccライブラリに与える

私はこれらの係数を計算するためにlibmfccライブラリを使いたいと思います。しかし、私はフロートの配列を持っています。そして、関数getCoefficinetは2倍の配列を必要とします。私はこの関数のパラメータを上書きしようとしましたが、それでも動作しません。最善の解決策は、私がこの関数から浮動小数点を取得する場合です。そして、パラメータの大きさは何ですか、それは入力配列のサイズですか、それとも

0熱

1答えて

.wavファイルをmfccから生成する

.wavファイルからMFCCを抽出するにはseveralsolutionsがあるようですが、MFCCのシーケンスから.wavファイルを再構築する方法や、置換MFCC？私は、それがオーディオファイルのいくつかの情報を失うことになることを理解します。

-2熱

1答えて

2D配列Pythonを使用した分類

私は音声認識アプリケーションを構築しようとしています。これまで、私はすでに10サンプルの音声からmfcc機能を抽出しています。以下に示すような各サンプル収率異なる形状を：（698、12）（414、12）（610、12）（586、12）（ 698、12）（282、12）（250、12）（370、12）（694、12）（490、12）私はこれを行うためにk最近傍（または他の分類ア

-1熱

1答えて

TypeError： 'module'オブジェクトは呼び出し可能ではありません。 MFCC

pythonを使用してスピーカー認識に基づいてプロジェクトを作成し、MFCCを見つけている間に次のエラーが発生しました。 Traceback (most recent call last): File "neh1.py", line 10, in <module> complexSpectrum = numpy.fft(signal) TypeError: 'module' obje

0熱

1答えて

TarsosDSPを使用してファイルからMFCCデータを抽出するにはどうすればよいですか？

私はこのexampleに基づいて自分のコードのMFCC抽出部分を作成しました。これは2つのAudioProcessorインスタンスを作成しました。しかし、Androidスタジオでデバッガを使用して、私はコードがすぐにprocessingFinished関数に入り、両方の処理関数をスキップしていることがわかりました。インスタンス内のmfcc変数は、2番目のAudioProcessor関数のproce

1熱

1答えて

HTK - HMMモデルと入力WAVファイルのMFCCは何を表していますか？

HTK（隠れマルコフモデルツールキット）を使用してSpeech to TextシステムのVoxforge's tutorialに続いてMFCCを作成する際、私たちは電話機のプロトタイプモデルを定義する必要があります。私はこのファイルの周りを頭で囲んでいます。 ~o <VecSize> 25 <MFCC_0_D_N_Z> ~h "proto" <BeginHMM> <NumStates

0熱

1答えて

MFCCとデルタ係数を使用すると、Log Likelihoodが奇妙になる理由

私は、オーディオストリームからMFCC機能を抽出する必要があるプロジェクトで作業しています。このプロジェクトは主に分類で構成されていますが、私たちのデータセットを拡張する目的で、私たちが分類に興味のある音の部分を分離するための検出アルゴリズムに取り組んでいます。私は別の表現を試していますが、データの性質上（詳細についてはお伝えしたいと思いますが、私が働いている教授がそれを私的に保つことを好むでし

0熱

1答えて

テンソルフローmfccとlibrosa mfccから正確に同じ結果を得ることは可能ですか？

私はこれがあるを私tensorflowコードでlibrosa で使用されているすべてのデフォルトパラメータに一致するようにしようと、異なる結果を持っている lybrosa MFCC tensorflow MFCC私のpythonと同じ結果を与える作るしようとしています私が使用しているtensorflowコード： waveform = contrib_audio.decode_wav( audio