2012-04-23 3 views
0

サウンド認識用のシステムを作成したいと考えています。一度訓練されたシステムは、同様の音を認識できる必要があります。例えば。シャワー、トイレ、火災報知器などの音がほとんどありません。私はフラットにシステムをインストールし、それらの音でそれを訓練します。シャワー、洗面所、火災警報器の音が少し違っている別の場所に設置すると、システムはこれらの音を認識できるはずです。それは可能ですか?どのようなテクニックを使うことができますか?私は、隠れマルコフモデル、ネールネットワークなどの音声認識技術について考えていましたか?類似のサウンドを認識する方法 - 技術

+0

これは非常に興味深い質問ですが、あまりにも曖昧であるため、あなたの投稿はDSPに属していると言われます。 –

答えて

0

これをニューラルネットワークで行うことに興味があれば、まず神経回路網に関する文献を読むことをお勧めします。また、ニューラルネットワークによる音声認識のいくつかの有用なノートはhere

見つけることができます基本的にこれは私がソフトウェアを自分自身を使用していないが、このリンクhere

でダウンロードできるソフトウェアのユーザガイドですが、私彼らはソースコードも提供していると信じています。 希望に役立ちます。

編集:ニューラルネットワークの逆伝播アルゴリズムを実装するコードプロジェクトのソースコードもいくつか追加されました。あなたを見てhere

0

FFTはあなたの友人です。このarticleはいくつかのトラックを提供します。

+0

私は既にFFTを実装していますが、指紋に基づいたShazamのようなアルゴリズムですが、録音されたサウンドが少なくともデータベースに保存されている音の短い区間に一致する場合のみこのアルゴリズムが使用されます。例えば。私は火災警報の指紋がDBに格納されています。それから私はこの音の間隔を記録し、認識されます。しかし、異なるスペクトルの火災警報の間隔を記録すると、それは認識されません。 – Radek

2

pattern recognitionアルゴリズムを探しています。たとえば、私はPCAが解決策になると信じています。まず、トレーニングサンプルのスペクトルシグネチャを抽出します。その後、PCAは新しいサウンドを最も近い既知のサンプルに分類します。

+0

PCAはソリューションの一部にすぎませんが、実際にはシグネチャの大規模な検索スペースを削減する単なる方法です。 – Edmund

0

前述のパターン認識/機械学習ソリューションに加えて、おそらくDynamic Time Warpingもご覧ください。

関連する問題