2017-05-31 13 views
0

マイクにあなたの発言を記録し、すべての単語を抽出するアプリを作成します。オーディオクリップから単語を抽出する

私はこれが多くの企業や個人が取り組んでいる問題であることを知っていますが、私はこれをうまく活用したツールを開発することからどのくらい離れているのかよく分かりません。

また、これを達成するために公開されているツールはありますか? Google Assistant、Apple Siriなどで提供されているAPIがあり、オーディオクリップをアップロードしてからその言葉を取得するだけで使用できることを願っています。

+0

あなたは[** pocketsphinx.js **](https://github.com/syl22-00/pocketsphinx.js)を見つけましたか?試してみる価値があるかもしれません。 – Tholle

+0

あなたがどれだけ役に立っているかわかりませんが、Amazon Echoとその開発者ツールでかなり良い結果が得られました。残念ながら、音声認識を自分で試すには実際のデバイスが必要です。開発キットはあなたの「スキル」に渡されるものだけを入力することを許可します。 –

答えて

2

GoogleにはGoogle Assistant SDKがありますが、主にGoogleホームに乗るように、ソフトウェアやデバイスからオーディオを送信し、アシスタントから音声応答を受け取ることを目的としています。同様に、Actions on Googleはすべての自然言語処理(NLP)を処理し、応答を提供するためのものであり、何が言われているかを正確に伝えるものではありません(副作用ですが)。

スピーチテキスト(STT)システムであるCloud Speech APIがほしいと思うように聞こえます。これをCloud Natural Language APIのようなものと組み合わせて、作成されたテキストから意味を解析することができます。

1

マイクロソフトはBing Speech APIを持っています。これは、音声を処理し、話される単語を抽出するために使用されます。

彼らはまた、Custom Speech ServiceSpeaker Recognition API

カスタム音声サービスは、話すスタイル、語彙やバックグラウンドノイズとして音声認識の障壁を克服するために使用されてきました。

利用可能なhelp docs and samplesは、開始するのに最適な場所です。

関連する問題