私は時間外でスーパーヒーローであり、話し言葉の音声を分析するアプリケーションを構築しようとしています。 (緊急/ 911コールを考える)キーワードが「強盗」であり、その単語がオーディオ内で話されている場合は、そのファイルにフラグを立ててテキストに翻訳したいと考えています。話し言葉や音声の音声ファイルを分析するためのライブラリはありますか?
このようなことをするために、開発ライブラリやソフトウェアアプリケーションはありますか? C++またはJavaのライブラリは推奨されていますが、必須ではありません。