2012-08-03 20 views
7

ホームオートメーションコマンド用のMicrosoft Speech C#APIを使用していますMicrosoft Speechを使用して音声パターンからスピーカーを識別する方法?

音声入力をハッシュして誰が話しているかを認識する方法または組み込みのC#メソッドがあるかどうかを知りたいと思います。 "Hello Alice"または "Hello Bob"と言うのは、AliceまたはBobです。

EDIT:

Microsoft音声APIは、記録のwavファイルを提供することができます。プロセスをハッシュすることができるかもしれない...話すだ人を理解すること:

  • 大声、遅い変調、... =>ボブ
  • 高い声、高速な変調、... =>アリス
+0

私は(のKinectスケルトン)を使用して、答えを探していないよか(RFIDタグのような)2段階の識別 –

+0

@VamsiKrishnaあなたが理解していない無:

あなたは自分のC#ここ&のPython SDKに見つけることができます。私は音声変調に基づいて誰がアリスやボブに会っているかを知る方法を探しています。 Microsoft Speechは、処理またはハッシュされる可能性のある.wavを提供できますか?誰が話しているかを知るために –

+2

@StackUnderflow私は同意しますが、それは良いはずの答えを受け入れることに同意します。間違ったことに答えるのも簡単です。また、StackOverflowの品質を低下させます。 –

答えて

2

スピーカーの認識は難しい問題であり、依然として活発な研究分野です。私は、マイクロソフトの音声APIは、話者の認識をサポートしているとは思っていませんが、100%確実ではありません。

トピックを調べているうちに次の記事が本当に役に立ちました。それは主題を紹介し、また非常に粗末な実装を提供します。おそらく始めるには良い場所でしょう。

http://www.ibm.com/developerworks/opensource/library/os-sndpeek/index.html

+0

ああ、非常にinterresting!ありがとう。私は少数のスピーカー(男性/女性)を特定するためのクルージング方法が存在することを願っています。 –

0

あなたは(とき話す誰見つける)スピーカーDiarizationの問題を解決しようとしているように見えます。それにはインターネット上で利用できるツールキットがたくさんあります。 LIUM:http://www-lium.univ-lemans.fr/diarization/doku.phpという1つ(Javaで実行)をお勧めします。

アリスとボブを区別して興味深い場合は、上のウェブサイトのスクリプトページでジェンダー検出の部分をご覧ください(またはhttp://www-lium.univ-lemans.fr/diarization/doku.php/gender_detectionに直接移動してください)。

関連する問題