2016-10-28 8 views
2

サンプルデータを使用してGoogle Speech APIをトレーニングして、アプリケーションでの認識を助けることは可能ですか?Google Speech APIの正しい認識結果

私が意味するのは、wit.aiが提供するようなアプローチであり、here(この例はnlp処理に適用されますが)と記載されています。基本的に、ユーザーがあなたのボットとやりとりする相互作用を予測できれば、より良い実行のためにトレーニングすることができます。たとえば、私はZurichと言うとボットを理解できないようですが、それはSyriaまたはSiberiaになりますが、私はすでにそれが不可能であることを知っています。だから、私が最初に使用される優先語のリストをアップロードしてから、一致するものが見つからない場合、標準認識やそれに類似したアプローチに置き換えれば、より良い結果が得られると思います。

これは可能かどうか、どんな考えですか?私はこれらのAPIがベータ段階にあり、変更されることは知っていますが、私はまだそれを試してみたいと思います。

私は現在行っていることのいくつかのコードサンプルをアップロードすることができますが、これはオーディオを送信してこれまでの結果を分析しています。

答えて

1

recognition configには、代替候補を指定してmaxAlternativesフィールド(最大30)を返すことができます。 30個の選択肢があると、信頼度はSyria0.5Siberia信頼度は0.01Zurich信頼度は0.1です。通常、正解は存在しますが、上にはない可能性があります。現在の状況に応じて最適な選択肢を選択できます。

+0

私はそれに取り組む時間がありませんが、私はこのプロジェクトに取り組む時間がありませんが、私があなたの答えが私を助けてくれたら、しかし、複数のオプションで見落とされている可能性があります、私は印象を持っていた1つだけがあまり分からない) – ThanksForAllTheFish

関連する問題