2016-06-01 12 views
1

私はRaspbianのJasperを試しています。 Jasper docsによれば、PocketSphinxによれば、CMUCLMTK、MIT言語モデリングツールキット、m2m-aligner、OpenFST、Phonetisaurusもインストールする必要があります。なぜジャスパーはそれほど多くの依存関係を必要としますか?

PocketSphinxのインストールが完了したら、の前にの依存関係をインストールする前に、pocketsphinx_continuousを使用して音声認識をテストしました。正確さにかかわらず、それは明らかに私のスピーチをキャプチャすることができ、解釈プロセスを経た。私も自分の.lm.dictファイルをCMUのlmtoolで作成し、問題なくpocketsphinx_continuousで試しました。

私の質問は次のとおりです。PocketSphinxはこれらの依存関係がなくても音声認識を実行できるようです。なぜジャスパーは私にそれらをインストールするように言いますか? PocketSphinxは本当にそれらを必要としますか?彼らはどのような目的を果たしていますか?

答えて

2

このリストには少なくとも2つは必要ありません。 CMUCLMTKとMITLMは、同じ機能を持つ言語モデリングツールキットです。オンラインのlmtoolを置き換えたい場合でも、それらのうちの1つだけが必要です。同じですが、Phonetisaurusはg2pモデルを訓練するためだけにMITLMとm2m-alignerを必要とします。

理想的には、MITLM、OpenFST、およびphonetisaurusを使用して、オンラインのlmtoolを置き換え、新しい単語をローカルに追加するだけです。 CMUCLMTKとm2m-alignerは必要ありません。

将来、PocketsphinxはPhonetisaurusのない新しい単語を扱うことができるため、この依存関係を削除することができます。

まだ苦情申し立てが可能な場合は、Jasper開発者に不平を言う必要があります。

+0

ありがとうございます。それは事をもっとはっきりさせます。これらの依存関係をインストールすることは、些細なことではなく、非常に時間がかかるラズベリーパイの作業です。私は彼らなしで逃げることが大好きです。 –

2

CMUCLMTK、MITLM、m2m-aligner、OpenFST、およびPhonetisaurusはPocketSphinxの依存関係ではなく、PocketSphinxでは必要ありません。

ジャスパーはCMUCLMTKを使用して言語モデル(.lm)をコンパイルします。

PhonetisaurusはOpenFST Libに依存します。

ジャスパーはPhonetisaurusを使用してDictionary(.dict)をコンパイルします。

JasperはMITLMとm2m-alignerを使用していません。

コーパスからG2P(FST)モデルをコンパイルするには、MITLM、m2m-aligner(一度のみ)とOpenFSTが必要です。

+0

最後のステートメントは正しくありません。 m2m-alignerはかつてg2pモデルの訓練に必要でしたが、今度はphonetisaurusに独自のアライナーが含まれています。 –

+0

@NikolayShmyrevあなたは正しいです。ジャスパー博士はとても古く、更新が必要です。 Btw lastest Jasperコード(jasper-devブランチ)は、PocketSphinx-5prealphaとともにプリコンパイルされたG2Pモデルをサポートします。 https://sourceforge.net/projects/cmusphinx/files/G2P%20Models/en_us_nostress.tar.gz したがって、JasperにはMITLMとm2m-alignerをインストールする必要はありません。 – G10DRAS

関連する問題