speech-recognition

    1

    1答えて

    MS SAPIが新しく、SpeechRecognitionEngineクラスを使用してC#/ WindowsフォームでWAVからTXTに変換するユーティリティを作成しようとしています。私は演説が完全に間違っていることに気づいた。言葉は同じように聞こえません。私は、入力WAVファイルの音質や認識エンジンに読み込まれた文法などの長い要素の影響を受ける可能性があると推測しています。私はDictation

    6

    1答えて

    私はSpeechRecognitionEngineで音声を認識するために使用されるGrammarBuildersとGrammerのプログラムを持っています。オーディオから認識するのではなく、入力されたコマンド(文字列)を認識するために同じ文法を使用できますか? commandGrammar.parse(commandString)のようなもの?

    2

    3答えて

    テキストを挿入するために音声入力を使用する必要があります。私が話しているときにどのようにキーワードを検出できますか? Android音声入力でこれを行うことはできますか、外部ライブラリが必要ですか? アイデア ありがとうございました

    0

    2答えて

    私はこれを多く見ましたが、役に立たないものは何も見つかりませんでした。これを行うためのAPIサポートもありますか?すべてのリンクとアイデアは非常に高く評価されます。

    2

    2答えて

    私はユーザーが最も近いホテルを見つけることを可能にするアプリケーションを作成しました。これでユーザーは音声を出して結果を見ることができます。しかし、ユーザーがそれらの名前を話す場合、 "コーチン"や "チェンナイ"のようなローカル名は結果に含まれません。しかし、 "ロンドン"、 "ニューヨーク"、 "ムンバイ"などの名前が表示されます。私が使用しているコードは以下の通りです。 private vo

    0

    1答えて

    これはこのトピックの最初のスレッドではないことがわかりますが、これに関するすべての記事を検索して、探しているものが見つかりませんでした。私は私の卒業プロジェクトをしており、音声認識もその一部です。私はそれについて多くのことを検索し、利用可能な別のSDKとC#の音声認識エンジンさえ知っています。私はこれらのコードを含めることはできません、私はゼロから私のものでそれを試してみる必要があります。 今、私

    5

    2答えて

    私は、Javaを使用してデスクトップアプリケーションを開発しています。このアプリケーションは、学校の子供が英語を教えるためのもので、ユーザーが英語のオーディオをアップロードできる場所は、テキストファイルに変換する必要のある任意の形式にすることができます。テキストを読むことができます。 私はいくつかのAPIを見つけましたが、わかりません。 http://cmusphinx.sourceforge.n

    1

    1答えて

    私はpcmデータから音声を認識するためのアプリケーションを開発中です。現在、私はpcmバッファを印刷しています。 int N = AudioRecord.getMinBufferSize(8000,AudioFormat.CHANNEL_IN_MONO, AudioFormat.ENCODING_PCM_16BIT); recorder = new AudioRecord(AudioSourc

    -1

    1答えて

    私は音声からテキストに変換するアプリをやっています。私はGoogle検索し、GoogleのスピーチのAPIはGoogleの選択であることがわかります。今私は質問を満たしている:ユーザーがiosデバイスに話すとき、どのようにオーディオファイルをキャプチャできますか?どのフレームワークまたはAPIを導入すべきか?また、生のオーディオファイル、WAVまたはMP3の種類は何ですか?ありがとうございました。

    2

    2答えて

    私は、ユーザーからコマンドを受け取り、リアルタイムで書き込むアプリケーションを作っています。私が取る最良の選択肢は何でしょうか?スフィンクスのようなサードパーティのソフトウェアや、組み込みの(アンドロイドの音声認識)を使うべきですか? 第二に、私はそれがリアルタイムで書きたいと思います、私が話すときのように書くのですか?