0

私はIBMワトソンのスピーチ・トゥ・テキスト・サービスを使用して、いくつかのテレフォニー・オーディオ・ファイル(8kHz)のトランスクリプトを生成しています。私は、同じファイルのwavとopusの両方のバージョンを試しました。 opus形式を使用している間、私は転写物の質の大きな低下を見たことがありません。私はストレージスペースの必要性を減らし、ファイル転送時間を短縮するために、ファイルのopus形式だけを格納することを考えています。一般に、より高品質の転写物にはwav形式を使用する方が良いですか? opus形式を使用すると、転写物の品質が低下することはありますか?wav対話:音声からテキストへのトランスクリプトの品質

答えて

0

あなたのユースケースの要件(現在と将来の両方)を知っているだけなので、まっすぐ答えを出すのは難しいです。それは、私は個人的には非常に偉大な作品の品質を発見したと言われています。ビットレートがOPUSの認識精度を劣化させるべきではありません十分である場合

2

:ここ

あなたは面白いかもしれませんオーパスコーデックの品質に関するいくつかのリンクです。精度を低下させない最低のビットレートを使用する必要があります。これは実験的に決定できます(異なるビットレートを試して、ワードエラーレートを計算してください)。

また、可逆性のFLACを使用することもできます。通常、圧縮されていないwavと比較して5倍の圧縮率を提供します。

最後に、サンプリングレートが16kHzより高くならないようにしてください。これは、認識には役に立たないため、記憶容量が大幅に増加するためです。

関連する問題