アプリケーションAPIを呼び出すためのアイデアです:パースの音声出力ここ
我々はJSONを受け入れさらさ安らかなAPIを備えたWebアプリケーションを持っています。では、Google音声APIを使用してユーザーの音声入力をテキストに変換し、そのテキストを何らかの形でAPIで必要なJSONに変換し、JSONでこれらのアプリケーションAPIeを呼び出します。ありますか?テキストを指定されたJSon形式に変換するライブラリですか?誰かがこのアプローチを使用しましたか?
アプリケーションAPIを呼び出すためのアイデアです:パースの音声出力ここ
我々はJSONを受け入れさらさ安らかなAPIを備えたWebアプリケーションを持っています。では、Google音声APIを使用してユーザーの音声入力をテキストに変換し、そのテキストを何らかの形でAPIで必要なJSONに変換し、JSONでこれらのアプリケーションAPIeを呼び出します。ありますか?テキストを指定されたJSon形式に変換するライブラリですか?誰かがこのアプローチを使用しましたか?
結果セットがすでにJSONで返されGoogle Speech APIによると:
{
"results": [
{
"alternatives": [
{
"transcript": "how old is the Brooklyn Bridge",
"confidence": 0.98267895
}
]
}
]
}
あなたが特定のJSON形式に配置するオブジェクトのうち、あなたが望んでいたものは何でもJSON.parseを使用して、選択されなければならないだろうすべて。私はGoogle Speech Documentation
これを読ん示唆し
は「意図の分析」と呼ばれています。例えば、このようなライブラリがあります。RASA
たとえば、「私に中国のレストランを見せてください」と入力します。出力は
{
"text": "show me chinese restaurants",
"intent": "restaurant_search",
"entities": [
{
"start": 8,
"end": 15,
"value": "chinese",
"entity": "cuisine"
}
]
}
です。全体的にかなり高度なNLUです。
彼はテキストを解析して意味論的エンティティを抽出する方法を尋ねると思います。 –