2011-12-26 15 views
2

誰でもオーディオパターン認識のライブラリを提案できますか?

私はサンプルのオーディオファイルを持っており、それを別のオーディオファイル(オーディオファイル内の認識フラグメントの開始時間と終了時間など)で見つける必要があります。このタスクを実行するライブラリはありますか?

+0

[オープンソースの音声パターン認識(指の印刷)]の複製が可能です。(http://stackoverflow.com/questions/6269167/open-source-audio-pattern-recognition-finger-printing) – user

答えて

2

1)CMU Sphinx。音声認識用のオープンソースツールキットです。

概要CMUSphinxは、BSDスタイルのライセンスでリリースされた、スピーカーに依存しない大語彙連続音声認識プログラムです。また、オープンソースのツールとリソースの集まりであり、研究者や開発者が音声認識システムを構築できるようにします。

2)RWTH ASR(ショートRASR)は、オープンソースの音声認識ツールキットです。

概要このツールキットには、自動音声認識システムの開発のための最先端の音声認識技術が含まれています。 RWTHアーヘン大学のヒューマン・ランゲージ・テクノロジーおよびパターン認識グループによって開発されました。

3)Julius:「Julius」は、スピーチ関連の研究者や開発者向けの高性能な2パス大語彙連続音声認識(LVCSR)デコーダソフトウェアです。

私はさらに多くの結果を提供するかもしれませんが、私は上記の3つは十分以上であると思います。

+0

これら3つのすべてが見えます「スピーチ」パターンマッチングに合わせて調整されます。 "拍手"や "警察のサイレン"のパターンマッチングのような一般的な音はありますか? – Connor

関連する問題