2017-11-30 8 views
0

私はTwilioMLを使用してユーザーの入力を収集しています。twilioがspeech2text処理にかなりの遅延を集める

私が見ているのは、かなりの遅延です.4-6秒です。ユーザーが発言を停止してからサービス(エンドポイント)が呼び出されるまでの時間です。これは非常に単純な文章でも起こります(例えば、私の名前はジョンです)。

これは既知の問題ですか?ユーザーエクスペリエンスの観点からは、それは素晴らしい経験ではありません。

私は 'filler'を追加しようとしましたが、それ以前に開始できるのはエンドポイントが呼び出されたときであるため、何の効果もありません。 オーディオがテキストに変換されている間にファイルを並行して再生する方法があるかもしれません。

答えて

0

documentationから:

「タイムアウト」属性は、Twilioは が上に移動しての要求を行う前に、別の数字を押すか、別の単語を言うために、発信者を待つ秒で制限を設定します'アクション' URL。たとえば、 'タイムアウト'が '3'の場合、Twilioは発信者が に別のキーを押すか、別の単語を言うまでに3秒間待ってから、「行動」URLに を入力します。 Twilioは、 のタイムアウト時間を開始する前に、すべてのネストされた動詞の実行を完了するまで、 まで待ちます。

遅延が4〜6秒になっているのは、デフォルトのタイムアウト設定が5秒であるためです。

URLをpartialResultCallbackにしましたか? Twilioを設定すると、リアルタイムで音声認識の結果をこのURLに送信します。通話者が特定の言葉を言うことを期待している場合は、認識をスピードアップできるのでヒントを付ける価値もあります。

+0

私はコールでタイムアウトを設定しましたが、それは高すぎると推測します。ユーザーエクスペリエンスが向上したかどうかを確認するために、より小さなタイムアウトでいくつかのテストを実行します。ありがとう! – Clca

+0

私は後で考えた2つの提案で自分の答えを更新しました – miknik

+0

さらに、実際に['speechTimeout'](https://www.twilio.com/docs/api/twiml/gather#attributes- speechTimeout)を使用して、 ''と音声入力で使用します。ユーザーが音声で一時停止するとあなたの行動を呼び出すことを意図した 'auto'に設定しようとするかもしれません。詳細については、マニュアルを参照してください。 – philnash

関連する問題