0
IBM音声対テキストAPIを使用して、メッセンジャーの音声をテキスト・スクリプトに転写しようとしています。w4a形式のオーディオ(Node.js)を使用したIBMスピーチ
request({
uri: attachment.url,
method: 'GET',
encoding: null
}, (err, res, audio) => {... do something...}
私はメッセージを取得するURLからオーディオファイルを取得するリクエストを使用します。 しかし、どうすればよい私だけW4Aファイルを取得することができ、ワトソンだけ
オーディオ/ FLACをサポートしています
オーディオ/ WAV
オーディオ/ L16
オーディオ/ oggの
私はw4a形式のオーディオを仕様に合うようにwavに変換します。
これを行うには他にも方法がありますか?
ありがとうございました。
検索するキーワードは「nodejs」と「ffmpeg」です。何かのようなhttp://stackoverflow.com/questions/33725893/how-do-you-use-node-js-to-stream-an-mp4-file-with-ffmpeg –
実際にはワトソンの質問ですので、私たちが必要ですwatsonタグを追加して適切な注意を払う –
これは実際にオーディオ変換に関する質問です.Watson STTサービスでサポートされているオーディオ形式は次のとおりです。https://www.ibm.com/watson/developercloud/doc/speech- to-text/input.html webmもサポートされています –