1

私は、音声をテキストに変換する音声読み上げを使用するアプリケーションを開発します。精度は低いです。一部の文章には意味がありません。スピーチからテキストへの正確さを向上させる方法はありますか?第2節で、IBM Watsonの音声認識の精度が低い

http://book.vidalab.co/books/alice-in-wonderland

不思議の国のアリス:ここ

は一例です

は「オーバー自宅で行くには白のポーン広告を見るこの方法」 は自宅でオーバー」でなければなりません白のポーンあなたが白で」

『ラットをアリスを参照してください、この道を行くために

『赤と白』 はする必要があります』

「と白軍勝つためにしようとトライス双子の赤い」 あるべき「と白軍が勝つためにしようと赤の軍が勝利しよう」

+0

それはAIではありません。それがこの詩をどのように扱うかを見てください:http://www.waylink-english.co.uk/?page=16100 –

+0

私はそれが詩を解析することを期待しません。しかし、それは文学でうまくやっていない。たぶん文学も外れているのだろうか? –

答えて

1

をあなたは例のSpeechmaticsのために、さまざまなサービスを試すことができます、それはスピーカーを得ることで非常に良いではないですが、言葉がはるかに正確ワトソンからよりも、結果はこのようなものです:

Credits of Alice in Wonderland by Alice girs Timberg this is a box recording all of her vocal recordings are in the public domain for more information or volunteer. Please visit libber Vox dot org. 
I just listed stage directions read by McKayla Curtis Lewis Carroll. 
Read by Shannon Brown Alice read by Amanda Friday the Red Queen read by Shauna canat White Queen read by Elizabeth Klatt White Rabbit read by Todd Humpty Dumpty read by Jeff Machado written read by Brett Hirsch. 
The Mock Turtle read by Ted the alarm Mad Hatter read by Elliot gage the March Hare by Charlotte Duckett's dormouse read by Kimberly Krauss frog read by Larry Wilson Duchess read by L.A. Cheshire Cat read by Sarah Herschell Tweedle-Dee read. 
By Charlotte Brown. 
Do you do do I read by the sea a solo the King of Hearts read by Ted alarm the Queen of Hearts read by eating Ray Headrick knave by glorious Joe Carter pillar back at 2 loss to spot read by Dave Harris. 
Five Spot read by Dave Harith. Seven of spades read by Dave Hereth end of credits. 

姓認識は多くはない企業が適切にそれをやっている非常に複雑な作業です。

0

STTシステムには、音響モデルと言語モデルという2つの主要な部分があります。最初のものは、オーディオやスピーカーに関するもので、ノイズ、発音、アクセントなどを処理します。言語モデルは、与えられた言語の構造と、言葉に使用される単語に関するものです。

STTをテストする場合は、できるだけターゲットのスピーチに近いレコーディングを使用してください。考古学や詩についての一般的な演説、あるいは、例えば、医学的な書き起こしのために非常によく機能するシステムは、扱いがよくないかもしれません.e