speech-recognition

0熱

1答えて

現在、私はUWPアプリケーションに音声認識機能を実装しようとしていますが、これまではユーザーの音声を認識するための連続口述機能を作成していますが、文法ファイルの文法を作成して追加する方法は？ここが連続認識のための私のコードです：あなたの条件については protected async override void OnNavigatedTo(NavigationEventArgs e) {

0熱

1答えて

C＃の音声認識部分 - 私は私がやろうとしています何Windows.SpeechのAPI を使用していますwindows.speech

は、システムがフレーズの一部を認めるのではなく、全体のことを探してもらうです。たとえば、 "How are you"という文字列をロードすると、ユーザーは正確に言うと、あなたはどうですか？最終的には、Windows.Speechにもこのようなことを認識させていただきたいと思います。「お元気ですか？ここでは、私が現在持っているものです。 //This is used for Building t

1熱

1答えて

クラスラベルを波形プロットのデータポイントに合わせる

現在、抽出されたターゲット値を波形プロットに揃えようとしています。抽出された目標値は、発声されている単語が（はい、いいえ、無音）かどうかを判断する音素クラスである。私は目標値を波形と適切に揃えようとしていましたが、目標クラスと波形のどこに配置されているのかが何らかの原因で終わってしまいました。例：プロットは、文「いいえいいえいいえはいいいえはいいいえ」発声のための波形を示しています。 0 は

-1熱

1答えて

Python音声認識プログラムが特定の場所にハングアップする傾向がある

このプログラムは完了していませんが、進行中の作業です。 import speech_recognition as sr import subprocess as sp import time, os r = sr.Recognizer() print("Voice Recognition Software\n\n***************************************

0熱

1答えて

AudioContext入力の設定

WebページでSpeechRecognition APIを使用しています。私はユーザーが話すときに視覚化を表示したいと思います。たとえば、theseのようなバーを表示することができます。その例に示すコードを見ると、AudioContext APIを使用する必要があるようです。私の課題は、SpeechRecognition APIをAudioContext APIにリンクする方法がわかりません。これ

-1熱

1答えて

トランスクリプションを生成するためにビデオを再生する必要があります

私は、ビデオ自体から字幕を生成するための音声認識についての論文を作成しています。コンセプトは、ビデオプレーヤーを作り、音声認識を統合することを計画しています。したがって、システムを起動してビデオが終了するまで再生すると、システムはそのビデオファイルの別のコピーを生成しますが、この時間のサブタイトルは既に含まれているか、またはそのサブタイトルに統合されています。このコンセプトは可能ですか？もしそうな

0熱

0答えて

Pythonの音声認識ライブラリは常に同じ文字列を返します

私はGoogleの音声認識を使用しようとしています。私の問題は、マイクに何かを言った後、結果は常に同じです。私は0x111a8b358 で data = RecordAudio() データは、常にこの speech_recognition.AudioDataオブジェクトに等しいされたデータを取得しようとしているときには私の機能は、この def RecordAudio(): impo

0熱

1答えて

Googleサービスのない音声認識Epson GLass AR Appの場合

Androidデバイスでは音声認識がサポートされていますが、GoogleサービスをサポートしていないEpson Glass用のArアプリケーションを作成したいので、Google APIの音声認識機能が動作しません。テキスト機能に音声の機能を提供するSdkまたはライブラリがあります。私はインターネット上でたくさんの検索をしていますが、ソリューションのどれも私の問題を解決していません。Google

0熱

1答えて

.segファイルからのデータ抽出

私は、オーディオファイルのダイアリゼーション後に形成されたクラスタのデータを保持する.segファイルを持っています。ファイルには、次のデータがあります。 ;; cluster S0 [ score:FS = -32.694324625945725 ] [ score:FT = -33.32942628147711 ] [ score:MS = -32.847416329096404 ] [ s