2016-08-03 16 views
3

私はMicrosoft音声認識-REST APIを使用して、音声ファイルをテキストに変換しています。私はスピーチからテキストを得ることができますが、その一部だけを得ることができます。Microsoft音声認識REST APIに音声長の制限があります

長さが50秒を超えるオーディオファイルを使用している場合。最初の50秒間だけテキスト結果が返され、50秒後のものは無視されます。オーディオの長さに制限はありますか、何か不足していますか?

コードサンプル:https://oxfordportal.blob.core.windows.net/speech/doc/recognition/Program.cs

はあなたの助けが高く評価されています。 ありがとうございます。

Bishwa

+0

IBMのSTTサービスを試してみたいと思うかもしれませんが、1回のリクエストでオーディオデータを数時間送ることができます...デモ:https://speech-to-text-demo.mybluemix.net/ –

答えて

0

ドキュメントhereは言う:

アプリケーションが順番にの開始と終了を決定するためにサービスが使用され、音声の開始と終了を決定するために、オーディオエンドポイント必要があります要求。 1回のリクエストで10秒以上のオーディオをアップロードすることはできず、合計リクエスト時間は14秒を超えることはできません。

これは、あなたが幸運なことに50秒かかることを示唆しています。
代わりに、オーディオを小さくして複数の要求にする必要があります。

+0

こんにちは、Buh Buh 、 お返事をありがとうございます。私はHttpWebRequestのSendChunckedプロパティをtrueに設定しました。私は小さなチャンク(例えば、1024バイトのサンプルコード)でオーディオを送信しています。 – Bishwa