2017-01-24 5 views
-1

私のスクリプトは音声認識訓練をうまくやっていましたが、最近私はより多くのデータを訓練するようにスケールアップしようとしました。"backward.c"、421行目:音声を文字列に整列できません

ERROR: "backward.c", line 421: Failed to align audio to trancript: final state of the search is not reached 

これは何を意味しますか?それについて私は何ができますか?

とにかくモデルトレーニングが進行しているようですが、これが無視できるエラーかどうかはわかりません。

私はこのlinkをチェックアウトしましたが、私のオーディオは16KHzでサンプリングされていると確信しています。

答えて

0

としてはdocumentationで説明:

時々、オーディオ、データベース内の適切な転写 と一致していません。例えば、トランスクリプションファイルには "Hello world"という文字列がありますが、実際には "Hello hello world"と発音されます。 トレーニング プロセスは通常これを検出し、このメッセージをログに出力します。 このようなエラーが多すぎる場合は、 の何かを誤って構成した可能性があります。たとえば、音声とテキストの間に不一致があります。 または入力オーディオサンプルレートが間違っている

エラーがほとんどない場合は、 を無視することができます。 に正確な単語を入力してください。上記の場合は、 を編集し、 "Hello hello world"を 対応する行に入力する必要があります。 が音響モデルの品質に影響するため、このようなプロンプトをフィルタリングすることができます。その場合は、トレーニングでアライメント段階の強制 を有効にする必要があります。

関連する問題