オーディオストリームから音声を検出する方法

誰かが音声ストリームで話すときを判断する必要があります。私はハミングウィンドウを適用し、FFTを計算しました。ここから人間の声をどのように検出するのですか？オーディオストリームから音声を検出する方法

出典

2011-12-03 user1019710

このためにFFTを行う必要はありません。Voice Activity Detectionアルゴリズムを実装する必要があります。

出典

2011-12-03 19:36:29

私はFFTからの声を検出したいと思います。私はこれを行うことができますか？ – user1019710

VAD用のアルゴリズムが確立されているときに、なぜホイールを再発明したいのかは不明です。リンク先のWikipediaページを読んだことがありますか？ –

はい、私はそれを読んで、私は私の質問に関連する何かを発見していない。 – user1019710

独自の音声アクティビティ検出アルゴリズムを試したい場合は、FFTを最初の段階として使用できます。次に、特徴的な固定スペクトルノイズの背景を差し引いてみてください。次に、修正されたFFT結果を使用して、特徴抽出のためのケプストラム（またはいくつかの重み付けケプストラム係数）を計算することができます。次に、抽出することを決めたどのような特徴ベクトルでも統計的パターンマッチングを行い、その結果を決定アルゴリズムに供給することができます。

上記の手順のそれぞれは、おそらく研究トピックであり、優れた実装には、数多くの公開された研究論文を勉強する必要があります。これはおそらくあなたの大学図書館にあります。

出典

2011-12-03 23:43:21 hotpaw2

ありがとう、私はそれを調べます。 – user1019710

オーディオストリームから音声を検出する方法

答えて

関連する問題