誰かが音声ストリームで話すときを判断する必要があります。私はハミングウィンドウを適用し、FFTを計算しました。ここから人間の声をどのように検出するのですか?オーディオストリームから音声を検出する方法
2
A
答えて
1
このためにFFTを行う必要はありません。Voice Activity Detectionアルゴリズムを実装する必要があります。
2
独自の音声アクティビティ検出アルゴリズムを試したい場合は、FFTを最初の段階として使用できます。次に、特徴的な固定スペクトルノイズの背景を差し引いてみてください。次に、修正されたFFT結果を使用して、特徴抽出のためのケプストラム(またはいくつかの重み付けケプストラム係数)を計算することができます。次に、抽出することを決めたどのような特徴ベクトルでも統計的パターンマッチングを行い、その結果を決定アルゴリズムに供給することができます。
上記の手順のそれぞれは、おそらく研究トピックであり、優れた実装には、数多くの公開された研究論文を勉強する必要があります。これはおそらくあなたの大学図書館にあります。
+0
ありがとう、私はそれを調べます。 – user1019710
関連する問題
私はFFTからの声を検出したいと思います。私はこれを行うことができますか? – user1019710
VAD用のアルゴリズムが確立されているときに、なぜホイールを再発明したいのかは不明です。リンク先のWikipediaページを読んだことがありますか? –
はい、私はそれを読んで、私は私の質問に関連する何かを発見していない。 – user1019710