2017-06-15 28 views
-1

IBM Watsonサービスを使用してSpeech to Text変換を行うC#windowsアプリケーションでWindowsアプリケーションを作成しようとしています。C# - Watson - Speech to Text API

IBM Watson Speech to Text APIサービス https://stream.watsonplatform.net/speech-to-text/apiを実装して、ユーザーの音声を聞き取り、出力テキストを書き込む方法を教えてください。

私は多くの記事を検索しましたが、これらすべての例では、.wav(オーディオ)ファイルが入力として渡され、出力テキストが書き込まれました。

既存のオーディオファイル(.wavファイル)を渡すのではなく、このSpeech to Textをよりリアルタイムに実行しようとしています。

recognizer.SetInputToDefaultAudioDevice()のようなコードでMicrosoft.Speechを使用して同じ機能を実行できます。ここでの欠点は、DictationGrammerにフィードしなければならないことです。アプリケーションが音声を認識してテキストに変換できるようにします。

同様の作業をWatson APIサービスでも実行できますか?

答えて

2

.NETのIBMワトソンSDKは、音声ファイルをアップロードに対して、よりリアルタイムに転写するあなたの要件を満たすでしょうWebSocketををサポートしています:

WebSocketをするとの永続的な接続を確立し、単一のコールが含まれてWebSocketプロトコルを介したサービス

SDKはhereで、SDK内の音声対話の詳細はhereです。

関連する問題