cmusphinx

    0

    1答えて

    私は最終的にビデオファイルから字幕を抽出したいと思います。 現在のビデオファイルは物理ディスク上に配置されているため、列車/テストデータと見なされます。しかし、私は新鮮なビデオをアップロードしてウェブアプリケーションを実行していることを想像してください。私のウェブアプリケーションはロードタイムの​​間に字幕などを抽出する必要があります。

    1

    1答えて

    ちょうど短いテキストファイルから言語モデルを作成しました。私は英語とオランダ語の両方で、主に可能性を減らして認識時間を短縮するためにこれを行いました。 私は、SphinxツールキットとBasephinx lmをバイナリコンバータに使って作成しました。 オランダ語のモデルはここにあります:http://pastebin.com/txkxiAc6 英語のものはここにあります:http://pasteb

    0

    1答えて

    に話者適応のためのクラスタサイズを決定し、IはnrOfClusters(クラスタの数)パラメータ値であるべき次のコード Stats stats = recognizer.createStats(nrOfClusters); recognizer.startRecognition(stream); while ((result = recognizer.getResult()) != null)

    0

    1答えて

    私はsphinx4-5prealphaを使用してテキストと音声のアライメントを行っています。私はAcousticモデルとこのバージョンでパックされた辞書を使用します。何らかの理由で私は古いスフィンクス-4バージョンと同じAMと音響モデルを使用したいが、私は得る: java.lang.IndexOutOfBoundsException: Index: 13824, Size: 13824 at j

    1

    1答えて

    私はsphinx 5prealphaを使ってアライメントを行っていますが、結果が悪いです。私は異なるAMと辞書を試みましたが、結果は常に同じです。同じバージョンのAMと辞書を古いバージョン(sphinx4)で使用すると、非常に良い結果が得られます。このオーディオファイルとテキストの files 結果は5phrealxではなく、sphinx4に適しています。フランス語のAMと辞書を試してみると、違い

    2

    1答えて

    私はラップトップ(Linux Mint 17)にpocketsphinxをインストールして、WAVオーディオファイルをテキストに転記することを目指しています。オーディオはスペイン語であるので、私は同社のウェブサイトからVoxforge 0.2スペイン語モデルをダウンロードし、次のコードをコピー&ペースト適応しました: #include <pocketsphinx.h> int main(int

    1

    2答えて

    プロジェクトを使用して音声制御ロボットを構築し、CMUsphinxを見つけたオープンソースライブラリを検索しました。私のロボットはARMベースのマイクロコントローラ上に構築され、私はそれにLinuxやWindowsを持っていません。 ARMベースのマイクロコントローラでCMUsinを使用することは可能ですか?どうしたらいいですか? ARM uControllersでCMUsphinxを使用する代わ

    3

    1答えて

    私はpythonを使って音声認識をしようとしています。それに加えて、私は各単語の始めと終わりの時を知る必要があります。 私はむしろこれに対処できる無料のライブラリを使用したいと思います。私はSphinxがこれを行うことができると聞いてきましたが、(たとえとにかくPythonのために)何かの例が見つかりませんでした。 私は何か助けや提案をいただきありがとうございます。このような

    0

    1答えて

    私はCMU sphinx 4-5prealphaに慣れようとしています。 文法を使わなくてもすべてが認識でうまく動作しますが、実際にはあまり多くのコマンド/単語/フレーズを処理する必要はありません。だから、ここでいくつかのコードとエラースタックを行く: public static void main(String[] args) throws Exception { Configura