cmusphinx

    5

    1答えて

    自動音声認識エンジンを作成する基本的なステップについて理解しています。しかし、私は、セグメンテーションがどのように行われ、どのようなフレームとサンプルが得られるかという明確なアイデアが必要です。私が知っていることを書き留めて、私が間違っている場所で私を修正し、さらに私を案内する答えを期待します。 音声認識の基本的なステップ、私はそれを知っているよう: (私はファイル)入力データはWAV/OGG(ま

    5

    1答えて

    私はこのガイドをspeech recognitionで読んでいました。音声認識のためには、音響モデル、言語モデル、音声辞書という3つのアイテムが必要です。 Gstreamerを使用してマイクからキャプチャし、8kHz、16ビットPCMオーディオにリサンプリングするこのpython demoで再生したいと考えました。 私は言語モデルと発音辞書を指定することができることを確認し、私は[CMUによって提

    0

    1答えて

    CMUSphinxが提供するword_align.plスクリプトを実行しようとしています。 perl word_align.pl actualtext.txt batchOutputText.txt をしかし、端末は私に次のエラーが得られます:word_align.plライン60でハッシュの要素で初期化されていない値$ ref_uttidの 使用、ライン1 を次のように私は、コマンドを書きます

    3

    1答えて

    私はandroidでcmusphinxを使用しています。まず、Githubからダウンロードしたデモプロジェクトを実行しました。私は自分の辞書には独自のキーフレーズを作成して構築されたとき、それは次のようexecption FATAL EXCEPTION: AsyncTask #1 Process: edu.cmu.sphinx.pocketsphinx, PID: 5006 java.lang

    8

    1答えて

    私のアンドロイドアプリでCMU Sphinxをオフラインでトレーニングする必要があります。このパラメータを使用するthisプロジェクトをダウンロードしましたが、起動時にこのエラーが発生しました:Fatal signal 11 (SIGSEGV) at 0x0000001c (code=1)このエラーは、スフィンクスが音響モデルを見つけることができないときにも起こります。私は質問hereの答えを見つ

    1

    1答えて

    私はSphinx4を使ってライブ音声認識のチュートリアルプログラムを実行しようとしています。 public class LiveRecognition { public static void main(String[] args) throws Exception { Configuration configuration = new Configuration();

    1

    1答えて

    私はガールフレンドがtwitch.tvのために話すときに静止画像を得るためにsphinx4を使って頭を包み込みます。この一般的なミッテスの男のようなものhttps://www.youtube.com/watch?v=L2oUE-C2g6Y話す猫は私がエミュレートしようとしているものです。 画像を方程式に導入する必要があるときに失われてしまいます。私はこれを例として使ってきました。 `package

    -1

    1答えて

    キーワード認識にpocketsphinxを使用しようとしています。 pocketsphinx_continuous -infile -keyphraseとpocketsphinx_continuous -infile -kwsを正常に使用できます。出力はかなり冗長で、私はインターネット上でガイドやパーサを見つけることができません。私の出力要件は、キーワードが認識されたタイムスタンプを取得することで

    9

    2答えて

    E_INFOは一連のログを出力しています。私はそれをどのようにオフにすることができないのか分かりません。私はpocket/base sphinxのすべてのソースファイルからE_INFOを検索しましたが、フラグを設定する場所を見つけることができませんでした。 Windowsの -logfn nul

    3

    2答えて

    おはよう、 私はKinectのプロジェクトに取り組んでおり、センサーのマイクで捕捉した音声情報を使ってジェンダー認識を行う必要があります。 認識はテキストベースでもありえます。つまり、ユーザーが言った文章は常に同じである可能性があります。私は "ちょうど"バイナリ回答男性/女性が必要です。 私は非常に普及しているオープンソースのSphinxをチェックしましたが、私のニーズに使用できるかどうかは分か