1
MS SAPIが新しく、SpeechRecognitionEngineクラスを使用してC#/ WindowsフォームでWAVからTXTに変換するユーティリティを作成しようとしています。私は演説が完全に間違っていることに気づいた。言葉は同じように聞こえません。私は、入力WAVファイルの音質や認識エンジンに読み込まれた文法などの長い要素の影響を受ける可能性があると推測しています。私はDictationGrammarクラスを使用しています。MS SAPI SpeechRecognitionEngine C#で間違った転記をしました
味付けされた音声認識/デジタル信号処理の人々からのリードを感謝します。
ありがとう、私はこの1つを投稿した直後にスレッドを見ました、私の謝罪。私のWAVファイルは本当に無効です。 22050で再サンプリングし、符号なし8ビットとしてエクスポートした後、認識された音声の信頼レベルは〜8%からほとんど50%を超えました。私はそれが良いと思いますか? – user1229658
謝罪は必要ありません。それはよい質問であり、ドキュメンテーションはサポートされているフォーマットを明確に指定していません。最後に、サポートされているフォーマットを知る唯一の方法は、SupportedAudioFormatsをクエリするコードを書くことでした。 –