2016-06-02 15 views
1


こんにちは、みんな。 (この文章を書いても構いませんか?) HTKツールとサンプリングレート

私は、音声(単語)認識がHTKツールでシミュレートしようとしました。
そして、私は* .wavファイルを持っています。
一部のファイルには16KHzのサンプリングレートがあり、一部のファイルには44.1KHzのサンプリングレートがあります。

そして、各サンプリングレートについてmfccファイルを作成します。
しかし、すべての(16KHzと44.1KHzの)mfccファイルを使用してHMMモデルを作成します。

voice_16KHz.wav -> voice_1.mfcc 
voice_44.1KHz.wav -> voice_2.mfcc 
make hmm_model using voice_1.mfcc and voice_2.mfcc 

それは、異なるサンプリングレートを混合してHMMモデルを作ることOKですか?

私は確かに情報ではなく、提案を知っている必要があります。

読んでいただきありがとうございます。

答えて

1

1つのサンプリングレートだけをお勧めします。それは動作しますが、正確さが変わり、さらにMFCC設定ファイルの設定の詳細を変更する必要があります。 44.1KHzのファイルを16KHzにダウングレードするのはとても簡単です。