私は、人間と音声認識と音声合成(仮想アバター)を使って対話するプログラムに取り組んでいます。ユーザーはアバターと話すことができます。さらに、プログラムは、ユーザがリモートオペレータと話すことができるリモートモジュールを有する。遠隔オペレータは、アバターを介して話す。スピーチをテキストに変換し、テキストをスピーチに変換する
ユーザーがリモートオペレータと話すときに、私たちが現在行っていることは、リモートモジュールのテキストにスピーチを変換した後、メインモジュールにテキストを送り、テキストをスピーチに、スピードをスピーチに変換します。しかし、このメッセージが長くなると、大きな遅延が発生します(すべての音声を認識した後で、テキストを送信して音声に変換することができます)。したがって、これはユーザと遠隔オペレータとの間の良好な会話を可能にしない(ユーザは、他の人が話していることを認識してはならない、それはアバターがユーザと話しているように見えるはずであり、従って大きな待ち時間であってはならない)。
これをC#.NETで実装することは可能ですか?誰もがこれを達成するためのアイデアを持っていますか?