2012-02-22 20 views
5

私は比較する必要がある2つの.wavファイルを持っており、同じ単語(同じ順序も含む)が含まれているかどうかを判断します。Python音声比較

私はしばらくの間、最良の方法を探していました。 pyspeechにファイルを入力として使用する方法を理解できません。私はCMU sphinxプロジェクトを稼働させようとしましたが、GStreamerにPython 27を使用させることはできません。私は、DragonFlyと一緒に幸運に悩まされました。

私はPython27でWin7 64ビットを使用しています。誰にもアイデアはありますか?

ご協力いただきまして誠にありがとうございます。

+0

を見てかかることがあります – Daenyth

答えて

4

PySpeechを試すことができます。詳細はpyspeech (python) - Transcribe mp3 files?をご覧ください。私はこれを使ったことはありませんが、Windowsの音声認識エンジンを活用していると思います。これにより、Wavファイルをテキストに変換し、テキスト比較を行うことができます。

Windows音声エンジンを使用し、入力にwavファイルを使用するには、2つの要件があります。

  1. inprocレコグナイザ(SpeechRecognitionEngine)を使用します。共有認識装置はWavファイルを入力として使用できません。
  2. レコグナイザオブジェクトで、入力wavファイルを指定するためにSetInputToWaveFileを呼び出します。

音声認識エンジンは特定のサンプルレートしかサポートしていないため、wavファイルを再サンプリングする必要があります。サンプルあたり

  • 8ビット
  • 単一チャネルモノWindows上でうまく動作

  • 第PCMエンコーディング
当たり
  • 22,050サンプル。詳細については、https://stackoverflow.com/a/6203533/90236を参照してください。窓のスピーチエンジンのいくつかのより多くの背景については

    、あなたは[dsp.se]に見えるかもしれませんSAPI and Windows 7 ProblemWhat is the difference between System.Speech.Recognition and Microsoft.Speech.Recognition?

  • 関連する問題