私は無知を赦してください。私は緊急のラジオアナウンスの記録を取ろうとしていますexample1example2。明らかに、私は高度なASR(自動音声認識)ツールのどれもそれから何の意味もないので何か間違っています。緊急録音の音声認識
私はIBM Watson、Google Speech、さらにCobaltを試しました。誰もオーディオから最も基本的な情報を集めることはできません。
ここでは2部構成の質問です。上の例のようなオーディオはASRツールでも使用できますか? APIを送信する前に私がしなければならないいくつかの変換がありますか?
音声認識の仕組みを理解していますか? – matt