speech-recognition

    0

    1答えて

    音声認識モジュールを使用して音声をテキストに変換しようとしています。 私のコードで始まる: import speech_recognition as sr r = sr.Recognizer() m = sr.Microphone() with m as source: print("Say Something...") audio = r.listen(source)

    0

    1答えて

    いいえ 私はすでに何か私はすでに私がテストをアップロードしたオーディオのデータを持って、次のステップは、フォームを介してオーディオをアップロードし、プロセスがAJAXを介して行われます実装するつもりです 。 <form id="formFile"> <div class="form-group"> <label for="vb-file">Agregar Archivo:</l

    0

    1答えて

    の平均値/平均値を取るように言って何を意味するのでしょう。私は実際にノイズリダクションをしようとしています。私はスペクトル減算法を使用しています。多くの理論論文やアルゴリズムでは、これを実行しながら、オーディオ信号のフレームを取得するように言います。そのため は、Iサンプリング周波数= 16kHzのための各フレームすなわち、長い20ミリ秒を要し、Iは、16kHzのの*の20ミリ秒の= 320個のサ

    0

    1答えて

    ながら、私はリリース(https://sourceforge.net/projects/cmusphinx/files/sphinxbase/5prealpha/)からSphinxbaseとPocketsphinxを使用して、私は次のエラーを取得していますインストール中にしています: /sphinxbase/src/libsphinxbase/util/profile.c: In function

    0

    1答えて

    私はgTTSを使った音声認識プロジェクトに取り組んでいます。問題は、私がコードを実行すると、システムはそれに応答しないということです。 (それは私の質問に答えることはできません)私は私の知る限り試しましたが、解決できませんでした。もし誰かがこれを解決するのを助けることができたら、本当に感謝します。非常に前もってありがとう。ここ は私のコードです: import speech_recognition

    1

    1答えて

    私は現在、ユーザーが製品(Raspberry Pi 3)と話すことができるいくつかの機能を作成する必要があるプロジェクトに取り組んでいます。話をすると、ユーザーは"製品の開始"のような1つまたは2つの単語をPiに言うことができるはずで、それがアクティブになり、そのことが起こります。 これで、Piは、単語の特定の組み合わせがユーザーによって言われたときに、引き続き聞くことができ、アクティブになる必要

    1

    1答えて

    私はGoogle Voiceサービスをマイクではなくビデオファイルで使用したいと考えています。 たとえば、ビデオファイルがコンピュータで再生されており、Google音声認識プログラムがビデオのオーディオストリームを認識しています。例)Youtubeの自動字幕機能。 G.S.Rはどのように使用できますか?

    0

    1答えて

    this linkを使用して音声認識装置を構築しています。これを実行した後、私は200エポック後、トレーニングレーベルのエラー率は1.023から0.085に低下しましたが、検証ラベルエラー率は1.347から0.843にしか減少しませんでした。その後、検証ラベルエラー率はそれ以上低下しません。 誰でもネットワーク構造の変更やハイパーパラメータの変更を提案して、検証ラベルのエラー率を改善できますか?

    0

    1答えて

    私のアプリにいくつかのキーワードを追加して、APIがより効率的に話し言葉を認識できるようにしたいと思います。 例えば、I m having trouble recognizing the some Italian words that starts with E(例えば、1人当たり)。またはドイツ語で(エルゲット)。ここで は私のコードです:異なるケースの言語を設定 public void rec