iOSネイティブアプリクライアントは、直接対話モードのWebソケットを使用してBluemix speech2textサービスを呼び出します(非常に速く、非常に短い待ち時間)。しかし、私たちはオーディオストリームのコピーを保持する必要があります。ほとんどのオーディオクリップは短いです(< 60秒)。それを行う簡単な方法はありますか?WebSocketからの音声をBluemix speech2textサービスに呼び出す方法を教えてください。
私たちは確かに、クライアントがオーディオクリップをバッファリングし、都合の良いときにアップロードすることができます。これにより、特に長いクリップの場合、メモリ占有量が増加する可能性があります。また、慎重に行わないと、アプリのパフォーマンスに影響を与えます。
また、プロキシ経由でHTTPインターフェイスとリレーを使用して、コピーを保持することもできます。ここで懸念しているのは、メインコールスレッドで余分なホップが発生するため、待ち時間が長くなる可能性があるということです。
洞察が得られるでしょう。
プロキシを使用し、SDKでプロキシURLを指定します。プロキシがJavaのようなマルチスレッド言語を使用することを確認する必要があります。多くのI/Oを実行するため、 –
の2つの主要なオプションがあります。1)WebSocketプロキシを使用して、Watson STT 。 2)メモリに問題が発生しないように、オーディオをストレージソリューションにストリームとしてチャンクした転送エンコードでPOSTを実行します。これはバックグラウンドスレッドで行われ、非常に安価でなければなりません。 –
私は秘密裏に、Watson STTの最後のオーディオクリップを何らかの形で入手する方法があると思っていました。その短い、両方のプロキシの提案は合法的だと思う - 私たちは彼らに試してみましょう。どうも。 –