2017-12-21 22 views
1

私は無知を赦してください。私は緊急のラジオアナウンスの記録を取ろうとしていますexample1example2。明らかに、私は高度なASR(自動音声認識)ツールのどれもそれから何の意味もないので何か間違っています。緊急録音の音声認識

私はIBM WatsonGoogle Speech、さらにCobaltを試しました。誰もオーディオから最も基本的な情報を集めることはできません。

ここでは2部構成の質問です。上の例のようなオーディオはASRツールでも使用できますか? APIを送信する前に私がしなければならないいくつかの変換がありますか?

+0

音声認識の仕組みを理解していますか? – matt

答えて

2

上記の例のようなオーディオは、ASRツールでも使用できますか?

はい、あなたはかなり信頼できると認識することができますが、カスタムASRシステムを構築する必要があります。これは従来のオーディオシステムでは機能しないためです。

APIを送信する前にいくつかの変換が必要ですか?

いいえ、それはデータのあなたの非常に特定の種類に訓練を受けた専門のモデルを使用してはるかに生産です。

コバルトはこれに対してカスタムソリューションを構築できます。 Kaldiのようなオープンソースのツールキットを使って、自分でモデルを構築することができます。このようなオーディオのための特別なソリューションを確認する別の会社はAdacelです。彼らは空港の塔で働くので、同様のタイプのオーディオを持っています。

件名の研究については、Apollo mission transcription systemのプロジェクトを確認することができます。

さらに音質を向上させるためには、さらに努力する必要があります。

+0

優秀!私の仕事は私のために分けられているように見えますが、これはまさに私が知る必要があったものです。 –