2016-04-04 7 views
-2

...CまたはPythonでの音声認識と分類ライブラリ

こんにちは、みんな!

私は、音声認識に関してDo-It-Yourselfデバイスを作ろうとしている学生です。あまりにも正確ではなく、音声認識のように複雑ではない、私はちょうど私の小さなアプリのためのいくつかの簡単な認識ライブラリを採用し、使用したい。

私がしたいことは、言い換えれば、「ワイドレンジ」での音声認識です。すなわち、「ブーム!ブーム!」という音がある場合には私は本当にそのようなことを認識する必要はありません "それはシボレーコルベットZ06からの特定のエンジン音です。いいマシンでしょうか?" (X) ではなく、そのようなものであることを認識するために、 「車に来て、大きくて騒々しい」 (O)これで十分です。

または「Ka-boom!」という音がある場合は、 「バン!」と言っても、私はそれを認識する必要はありません。 "今年の冬には花火が遊びますか? (X) しかし、 「火災ブーム。私は決してそこに行かないだろう。 (O) これで十分です。 ... など。つまり、私は匿名ライブラリで音を「分類」し、それを私のアプリケーションが提供するガイドラインの有益な情報として使用したいと考えています。

参考になる参考資料やおすすめライブラリはありますか?私はあなたの大きなアドバイスを待っています。ありがとうございました。

よろしく、

J.パーク

答えて

0

あなたは(そうではない、本当にC)C++ライブラリのオープンしている場合:

Aquila

しかし、あなたは自分をdeveloppする必要がありますレコは、ノイズのラベルが付けられたサンプルのベースを使用することによって行われます。長いプロジェクトですが、フーリエ、DTWなどの信号処理に精通していますか?これを行うための標準的なプロセスがあります。

+0

ライブラリAquilaを確認しました。あなたの助言に感謝します。 –