Watson Text to Speechサービスを使用して、MP3 & WAV形式のオーディオファイルを生成しています。これらのオーディオのデフォルトのサンプリング周波数はどれくらいですか? API(MP3 & WAVの場合)に当たっている間にサンプリングレートを指定する方法はありますか? Watson Speech to Textでは、ブロードバンドモデルに16 kHzの音声を使用することを推奨しています。IBM Watson Text to Speechサービスによって生成される音声のサンプリング周波数はどのくらいですか?
0
A
答えて
0
デフォルトのサンプリングレートは22,050 Hzで、レートパラメータを使用して指定します。私が見ることができるドキュメントから、それはオプションのパラメタです。 FYR-https://console.bluemix.net/docs/services/text-to-speech/http.html#format
0
これらの情報は、ドキュメントで簡単に見つかります。
TextTo音声ボイスは22050 Hzで作成されますが、異なる出力サンプリングレートを強制することができますが、サービスは結果を提供する前にのみダウン/アップサンプリングします。
SpeechToTextは一般に、BroadBandでは16000 Hz、狭帯域では8000 Hzをサポートします。最良のことは、ヘッダー、フラック、wav(pcmではない)にサンプリングレート情報を持つオーディオをコンテナ内で使用することです。 SpeechToTextに関しては、オーディオが実際に関連スペクトルの情報を持つことが重要であるため、16kHzに8kHzの電話通信をアップサンプリングしてブロードバンドモデルに送信することはできません。
関連する問題
- 1. IBM Watson Speech to Text and webm
- 2. IBM Watson Speech to Textサービスへの非同期Python HTTPポストリクエスト
- 3. IBM Watson Speech-to-textの「ストリーム」とは何ですか?
- 4. Watson Text to Speech blank
- 5. C# - Watson - Speech to Text API
- 6. IBM Watson Speech to TextサービスがUnity3dで応答を出していない
- 7. Androidの音声周波数
- 8. IBM Watson Speech-to-Text JavaScript SDK:メッセージの取得方法は?
- 9. IBM Watson Speech to Speech APIはありますか?
- 10. Watson Speech To Textサービスは、どの種類のオーディオファイルに対してより速く動作しますか?
- 11. WebSocketを使用したIBM Watson Speech to Text
- 12. node.jsにWatsonのtext-to-speech APIを使用するには?
- 13. マイクからの音声の周波数を知る方法
- 14. MFCCサンプリング周波数
- 15. Watson Nodejs Speech To Text - train言語モデル
- 16. IBMのspeech-to-text APIにカールを付けてアクセスするにはどうすればよいですか?
- 17. JavaスクリプトからWatson Text to Speechの認可問題
- 18. ユーザーが音声を録音するときに音声周波数グラフを作成しますか?
- 19. ノードを持つIBM Watson Speech to Text API。 DOMへの出力方法
- 20. IBM Waston Speech to text APIのキーワードスポッティング機能の使用方法は?
- 21. ドイツ語サーバーへのWatson Speech to Textの要求
- 22. React-Native Speech to Text
- 23. WatsonのSpeech-To-Text Unity SDKでは、どのようにキーワードを指定できますか?
- 24. スピーカーからWatsonのテキスト音声応答を再生するにはどうすればよいですか?
- 25. 生のオーディオを録音してから周波数を取得するには?
- 26. Google Speech-to-text APIを設定するにはどうすればよいですか?
- 27. WebSocketを使用してWatson Speech To Textにエラーが発生しました
- 28. AVSpeechSynthesizer(Text to Speech)再生の音量は、iPhone7のみで増加します。
- 29. IBM Watsonの音声認識の精度が低い
- 30. Shiny Watsonテキストリアルタイム音声
ご返信ありがとうございます。テキストへのスピーチは、22,050 Hzの周波数オーディオに対して最大の精度を与えると言えますか?私は44100 Hzの周波数で録音されたステレオ品質のオーディオを試しました。その結果は間違っています。しかし、Text to Speech(デフォルトの22050 Hzの周波数を使用)を使用して生成されたスピーチでは、正確な結果が得られます。 – ShwetaJ
私は正確さについてはわかりませんが、オーディオ/ wav; rate = 44100のように44100でレートパラメータを使用しようとしましたか? – Varun
はい。 rateパラメータはSpeech to Textでは機能しません。それでも間違った結果が出ます。 – ShwetaJ