2011-02-02 8 views
4

私は時間外でスーパーヒーローであり、話し言葉の音声を分析するアプリケーションを構築しようとしています。 (緊急/ 911コールを考える)キーワードが「強盗」であり、その単語がオーディオ内で話されている場合は、そのファイルにフラグを立ててテキストに翻訳したいと考えています。話し言葉や音声の音声ファイルを分析するためのライブラリはありますか?

このようなことをするために、開発ライブラリやソフトウェアアプリケーションはありますか? C++またはJavaのライブラリは推奨されていますが、必須ではありません。

答えて

1

Wikiページhereは良い出発点です。そこに記載されているもののうち、私はCMU Sphinxが最もアクティブなものだと思います。

1

Praat http://www.fon.hum.uva.nl/praat/と一緒に作業することができます。これは音声学を扱う優れたプログラムであり、独自のスクリプト言語です。 Praatコミュニティには多くのスクリプトもあります。 sendpraat http://www.fon.hum.uva.nl/praat/sendpraat.htmlを使用して、praat関数をサブルーチンとして使用することもできます。

関連する問題