speech-recognition

    0

    1答えて

    現在、私はUWPアプリケーションに音声認識機能を実装しようとしていますが、これまではユーザーの音声を認識するための連続口述機能を作成していますが、文法ファイルの文法を作成して追加する方法は?ここ が連続認識のための私のコードです:あなたの条件については protected async override void OnNavigatedTo(NavigationEventArgs e) {

    0

    1答えて

    は、システムがフレーズの一部を認めるのではなく、全体のことを探してもらうです。 たとえば、 "How are you"という文字列をロードすると、ユーザーは正確に言うと、あなたはどうですか?最終的には、Windows.Speechにもこのようなことを認識させていただきたいと思います。「お元気ですか?ここで は、私が現在持っているものです。 //This is used for Building t

    1

    1答えて

    現在、抽出されたターゲット値を波形プロットに揃えようとしています。抽出された目標値は、発声されている単語が(はい、いいえ、無音)かどうかを判断する音素クラスである。 私は目標値を波形と適切に揃えようとしていましたが、目標クラスと波形のどこに配置されているのかが何らかの原因で終わってしまいました。 例: プロットは、文「いいえいいえいいえはいいいえはいいいえ」発声のための波形を示しています。 0 は

    -1

    1答えて

    このプログラムは完了していませんが、進行中の作業です。 import speech_recognition as sr import subprocess as sp import time, os r = sr.Recognizer() print("Voice Recognition Software\n\n***************************************

    0

    1答えて

    WebページでSpeechRecognition APIを使用しています。私はユーザーが話すときに視覚化を表示したいと思います。たとえば、theseのようなバーを表示することができます。その例に示すコードを見ると、AudioContext APIを使用する必要があるようです。私の課題は、SpeechRecognition APIをAudioContext APIにリンクする方法がわかりません。これ

    -1

    1答えて

    私は、ビデオ自体から字幕を生成するための音声認識についての論文を作成しています。コンセプトは、ビデオプレーヤーを作り、音声認識を統合することを計画しています。したがって、システムを起動してビデオが終了するまで再生すると、システムはそのビデオファイルの別のコピーを生成しますが、この時間のサブタイトルは既に含まれているか、またはそのサブタイトルに統合されています。このコンセプトは可能ですか?もしそうな

    0

    0答えて

    私はGoogleの音声認識を使用しようとしています。私の問題は、マイクに何かを言った後、結果は常に同じです。私は0x111a8b358 で data = RecordAudio() データは、常にこの speech_recognition.AudioDataオブジェクトに等しいされたデータを取得しようとしているときに は私の機能は、この def RecordAudio(): impo

    0

    1答えて

    Androidデバイスでは音声認識がサポートされていますが、GoogleサービスをサポートしていないEpson Glass用のArアプリケーションを作成したいので、Google APIの音声認識機能が動作しません。 テキスト機能に音声の機能を提供するSdkまたはライブラリがあります。 私はインターネット上でたくさんの検索をしていますが、ソリューションのどれも私の問題を解決していません。Google

    0

    1答えて

    私は、オーディオファイルのダイアリゼーション後に形成されたクラスタのデータを保持する.segファイルを持っています。 ファイルには、次のデータがあります。 ;; cluster S0 [ score:FS = -32.694324625945725 ] [ score:FT = -33.32942628147711 ] [ score:MS = -32.847416329096404 ] [ s