問題の要点は、IBM Watson Speech to Textは、FLAC、WAV、およびOGGファイル・フォーマットをアップロードしてAPIとともに使用できることです。Node.js WebアプリケーションでIBM Watsonスピーチからテキスト・オーディオへの変換
私の解決策は、ユーザーがmp3をアップロードしてからファイルをワトソンに送信する前に、データ変換が行われるということです。本質的に、ユーザーはmp3をアップロードし、ffmpegまたはsoxを使用してオーディオをOGGに変換し、その後オーディオをWatsonにアップロードします。
私が確信していることは、次の点です。Node.js Watsonコードで、オーディオ変換を行うために正確に何を変更する必要がありますか?下にリンクされているのは、私が取り組んでいるワトソンのレポです。変更が必要なファイルはfileupload.jsであることが確信していますが、その変更はどこにあるのかは不明です。
私はSOとdeveloperWorksの両方でこの問題の答えを探しましたが、なぜ私がここに投稿しているのかわかりません。それが必要な場合は、私の質問を明確にすることができれば幸いです。
は、私は現在、ファイル変換のためのffmpegを使用しています、これに質問をフォローアップ。しかし、このオーディオ変換ライブラリは、チャンクで行うのではなく、オーディオファイル全体をメモリにロードします。この問題の良い解決策は何でしょうか? – YAL