0
リアルタイムでオーディオストリームの音声部分を検出する簡単な方法は何ですか?私はMFCC、FFTなどを使用することについて悩みました。しかし、私はそれがどのように行われるべきかの明確な説明を見つけることができませんでした。Androidで音声から音声成分を検出する方法は?
また、wavファイルを分析して、そこに存在する人間の発話の存在を検出できるPCプログラムがありますか?
リアルタイムでオーディオストリームの音声部分を検出する簡単な方法は何ですか?私はMFCC、FFTなどを使用することについて悩みました。しかし、私はそれがどのように行われるべきかの明確な説明を見つけることができませんでした。Androidで音声から音声成分を検出する方法は?
また、wavファイルを分析して、そこに存在する人間の発話の存在を検出できるPCプログラムがありますか?
このトピックは非常に複雑です...;簡単な解決方法や明確な説明はありません。既存の技法およびアルゴリズムが多数存在する。現代の技術には、FFTやケプストラム解析などの些細なDSPアルゴリズムだけでなく、人工知能と機械学習アルゴリズムも含まれます。しかし、Sphinx-4はJavaで書かれているので、自然にクロスプラットフォームなのです。
http://cmusphinx.sourceforge.net/sphinx4/
私は私がいない...ので、私はその使いやすさについて何も言うが、最良のアルゴリズムが特許を取得していることを確認し、本当に、本当に高価になることはできませんよということ
を試していませんスピーチを認識する必要がある - スピーチ/ nponスピーチとして分類する必要がある –