.NETで音声認識を実装する方法は?.NETでの音声認識
私は、比較的高品質のコンピュータ生成音声で.mp3
Sの束を持っています。それぞれの.mp3
では、音声ではランダムなテキストが表示され、次に英語では6〜7桁の数字が表示されます。これらの数字をテキストとして抽出したいと思います。
.NETでこのようなことを実装することは可能ですか?
.NETで音声認識を実装する方法は?.NETでの音声認識
私は、比較的高品質のコンピュータ生成音声で.mp3
Sの束を持っています。それぞれの.mp3
では、音声ではランダムなテキストが表示され、次に英語では6〜7桁の数字が表示されます。これらの数字をテキストとして抽出したいと思います。
.NETでこのようなことを実装することは可能ですか?
あなたは、マイクロソフトSAPI SDKを使用することができます
いくつかのサンプルhere
を使用してその簡単。..エンジンをテキストにMicrosoft音声を使用することができます。
http://www.microsoft.com/downloads/details.aspx?FamilyID=5e86ec97-40a7-453f-b0ee-6583171b4530&DisplayLang=en
はSAPI SDKのC#の例をご覧ください。
はここであなたを助けるかもしれthe System.Speech.Recognition namespaceへのリンクです。
音声認識で作業する場合、Windows VistaまたはWindows 7でMicrosoft SAPI(Speech API)5.3を使用しているため(5.4もあります)、SAPI 5.1と比較してパフォーマンスが大幅に向上するWindows XPから。
今、hereあなたは、ほとんどあなたが望むことをするアプリケーションのビデオとソースコード(これはC++ですが、別の言語に渡すことができます)を持っています。
単語をよりよく認識するために、認識したい単語で文章ファイルを作成します。あなたはそのビデオを見ることができ、それがあなたが望むものを作るのは非常に簡単であることがわかります。
幸運を祈る!
ええ、これが最善の方法です。スピーチ認識/ TTSは.NET BCL 3.0に含まれています。 – Noldorin