私はMicrosoft音声認識-REST APIを使用して、音声ファイルをテキストに変換しています。私はスピーチからテキストを得ることができますが、その一部だけを得ることができます。Microsoft音声認識REST APIに音声長の制限があります
長さが50秒を超えるオーディオファイルを使用している場合。最初の50秒間だけテキスト結果が返され、50秒後のものは無視されます。オーディオの長さに制限はありますか、何か不足していますか?
コードサンプル:https://oxfordportal.blob.core.windows.net/speech/doc/recognition/Program.cs
はあなたの助けが高く評価されています。 ありがとうございます。
Bishwa
IBMのSTTサービスを試してみたいと思うかもしれませんが、1回のリクエストでオーディオデータを数時間送ることができます...デモ:https://speech-to-text-demo.mybluemix.net/ –