ニューラルネットワーク層でスペクトログラム変換を学習するのとは対照的に、最近のニューラルネットワーク音声認識システム(https://github.com/SeanNaren/CTCSpeechRecognition)でスペクトログラムを使用する理由は何ですか?なぜ最近のニューラルネットワーク音声認識システムでスペクトログラムを使用するのですか?
1
A
答えて
3
機能について何か知っている場合は、この情報を学習に頼る代わりに使用すると便利なことがよくあります。
たとえば、音声認識には信号エネルギーのみが重要であり、信号位相は重要ではないことが知られています。そのため、スペクトログラムを使用する方が普通の信号に比べて優先される理由は、重要な情報を使用して重要でないことです。エネルギー計算には四角形が必要で、単層で学習するのは容易ではありません。いくつかの層が必要です。また、特別な非線形性が必要です。
さらに実際には、log-filterbankを使用すると、同じ予測品質でさらにコンパクトな機能が得られます。
位相が重要なケースがあります。その1つは、DIETアルゴリズムのような位相情報に基づいてソースを分けることができる混合ソースの認識です。しかし、そのような問題が音声認識のために考慮されるまで、スペクトログラムが使用される。
関連する問題
- 1. 音声認識音声認識 - Ionic 2
- 2. Win7音声認識 - ユーザーを音声で認識しますか? .NETで
- 3. 音声分析でスペクトログラムをプロットする
- 4. フラッシュでの音声認識
- 5. C#での音声認識
- 6. iPhoneでの音声認識
- 7. .NETでの音声認識
- 8. Androidでの音声認識
- 9. Androidでの音声認識
- 10. バックグラウンドでの音声認識
- 11. Androidでの音声認識
- 12. OSXでの音声認識
- 13. iPhoneアプリの音声認識ですか?
- 14. 私のpythonスクリプトが音声ファイルからの音声を認識しないのはなぜですか?
- 15. 音声認識?
- 16. 音声認識
- 17. 音声認識の音声を録音する
- 18. node.jsでBing音声認識APIを使用するSkypeでボットフレームワーク
- 19. Android音声認識ですか?
- 20. C#音声認識ライブラリを使用した音声UIまたは音声認識
- 21. 音声認識なしで複数の音声を検出する
- 22. GoogleのサーバーをAndroidなしで音声認識に使用できますか?
- 23. なぜ音声認識で文法が必要なのですか?C#
- 24. 音声認識:通訳者の音声を音声から切り離す
- 25. 音声認識でarpaファイルを使用する方法
- 26. Google音声認識APIをPythonで使用するには?
- 27. uwp音声認識
- 28. 音声認識ツール
- 29. 音声認識ループ
- 30. 音声認識Api
プログラミングに関する質問ではありません - http://dsp.stackexchange.comを試してみてください。 –