私はTwilioMLを使用してユーザーの入力を収集しています。twilioがspeech2text処理にかなりの遅延を集める
私が見ているのは、かなりの遅延です.4-6秒です。ユーザーが発言を停止してからサービス(エンドポイント)が呼び出されるまでの時間です。これは非常に単純な文章でも起こります(例えば、私の名前はジョンです)。
これは既知の問題ですか?ユーザーエクスペリエンスの観点からは、それは素晴らしい経験ではありません。
私は 'filler'を追加しようとしましたが、それ以前に開始できるのはエンドポイントが呼び出されたときであるため、何の効果もありません。 オーディオがテキストに変換されている間にファイルを並行して再生する方法があるかもしれません。
私はコールでタイムアウトを設定しましたが、それは高すぎると推測します。ユーザーエクスペリエンスが向上したかどうかを確認するために、より小さなタイムアウトでいくつかのテストを実行します。ありがとう! – Clca
私は後で考えた2つの提案で自分の答えを更新しました – miknik
さらに、実際に['speechTimeout'](https://www.twilio.com/docs/api/twiml/gather#attributes- speechTimeout)を使用して、 ''と音声入力で使用します。ユーザーが音声で一時停止するとあなたの行動を呼び出すことを意図した 'auto'に設定しようとするかもしれません。詳細については、マニュアルを参照してください。 –
philnash