cmusphinx

5熱

1答えて

自動音声認識エンジンを作成する基本的なステップについて理解しています。しかし、私は、セグメンテーションがどのように行われ、どのようなフレームとサンプルが得られるかという明確なアイデアが必要です。私が知っていることを書き留めて、私が間違っている場所で私を修正し、さらに私を案内する答えを期待します。音声認識の基本的なステップ、私はそれを知っているよう：（私はファイル）入力データはWAV/OGG（ま

5熱

1答えて

PocketSphinx pythonと音響モデルの設定は？

私はこのガイドをspeech recognitionで読んでいました。音声認識のためには、音響モデル、言語モデル、音声辞書という3つのアイテムが必要です。 Gstreamerを使用してマイクからキャプチャし、8kHz、16ビットPCMオーディオにリサンプリングするこのpython demoで再生したいと考えました。私は言語モデルと発音辞書を指定することができることを確認し、私は[CMUによって提

0熱

1答えて

word_align.plスクリプトの実行時に「初期化されていない値」エラーが発生しました

CMUSphinxが提供するword_align.plスクリプトを実行しようとしています。 perl word_align.pl actualtext.txt batchOutputText.txt をしかし、端末は私に次のエラーが得られます：word_align.plライン60でハッシュの要素で初期化されていない値$ ref_uttidの使用、ライン1 を次のように私は、コマンドを書きます

3熱

1答えて

android-java.lang.RuntimeExceptionのcmusphinx：Decoder_setKeyphraseが返されました-1

私はandroidでcmusphinxを使用しています。まず、Githubからダウンロードしたデモプロジェクトを実行しました。私は自分の辞書には独自のキーフレーズを作成して構築されたとき、それは次のようexecption FATAL EXCEPTION: AsyncTask #1 Process: edu.cmu.sphinx.pocketsphinx, PID: 5006 java.lang

8熱

1答えて

CMU Sphinx（pocketsphinx）でDMP言語モデルの代わりにJSGF文法を使用する（-lmの代わりに-jsgfを使用）

私のアンドロイドアプリでCMU Sphinxをオフラインでトレーニングする必要があります。このパラメータを使用するthisプロジェクトをダウンロードしましたが、起動時にこのエラーが発生しました：Fatal signal 11 (SIGSEGV) at 0x0000001c (code=1)このエラーは、スフィンクスが音響モデルを見つけることができないときにも起こります。私は質問hereの答えを見つ

1熱

1答えて

Sphinx4でライブスピーチを認識するjava api

私はSphinx4を使ってライブ音声認識のチュートリアルプログラムを実行しようとしています。 public class LiveRecognition { public static void main(String[] args) throws Exception { Configuration configuration = new Configuration();

1熱

1答えて

誰かがJavaで話しているときに静止画を取得しようとしています

私はガールフレンドがtwitch.tvのために話すときに静止画像を得るためにsphinx4を使って頭を包み込みます。この一般的なミッテスの男のようなものhttps://www.youtube.com/watch?v=L2oUE-C2g6Y話す猫は私がエミュレートしようとしているものです。画像を方程式に導入する必要があるときに失われてしまいます。私はこれを例として使ってきました。 `package

-1熱

1答えて

ログなしでpocketsphinxからキーワード時間を取得する

キーワード認識にpocketsphinxを使用しようとしています。 pocketsphinx_continuous -infile -keyphraseとpocketsphinx_continuous -infile -kwsを正常に使用できます。出力はかなり冗長で、私はインターネット上でガイドやパーサを見つけることができません。私の出力要件は、キーワードが認識されたタイムスタンプを取得することで

9熱

2答えて

pocketsphinxでE_INFOをオフにするにはどうすればよいですか？

E_INFOは一連のログを出力しています。私はそれをどのようにオフにすることができないのか分かりません。私はpocket/base sphinxのすべてのソースファイルからE_INFOを検索しましたが、フラグを設定する場所を見つけることができませんでした。 Windowsの -logfn nul

3熱

2答えて

音声を使ったジェンダー認識のためのオープンソースツール

おはよう、私はKinectのプロジェクトに取り組んでおり、センサーのマイクで捕捉した音声情報を使ってジェンダー認識を行う必要があります。認識はテキストベースでもありえます。つまり、ユーザーが言った文章は常に同じである可能性があります。私は "ちょうど"バイナリ回答男性/女性が必要です。私は非常に普及しているオープンソースのSphinxをチェックしましたが、私のニーズに使用できるかどうかは分か