2017-11-10 10 views
-1

アプリケーションを作成しましたが、オーディオをテキストに変換するための.wavファイルのみをサポートしています。私はsphinxを使ってオーディオファイルをテキストに変換しています。私の質問は、なぜそれが.MP3からのテキストに変換されていないということですか?mp3ファイルをテキスト形式に変換できません。

+1

いくつかの詳細を入力すれば、(有用な)回答を得ることができます。あなたが得るエラーメッセージの詳細。 – barryhunter

+0

@barryhunter私が得ている出力は、何もエラーを表示していないので何も表示されません。なぜ私はそれが変換されていないのかわかりません.wavファイルを提供しているときは動作していますが.mp3では機能しません。 – Manu

+0

あなたはリードしましたかhttps://cmusphinx.github.io/wiki/faq/#q-how-can-i-decode-audio-encoded-with-a-codec-mp3-mu-law-mp4-g729 – barryhunter

答えて

0

CMU Sphinxドキュメントで指定されているように、リニアPCM WAVオーディオフォーマットのみが音声認識装置で受け入れられます。したがって、任意のMP3オーディオファイルは、16kHzのサンプリングレート、16ビット/フレーム、リトルエンディアンおよび1チャンネル(モノラル)のリニアPCMフォーマットを得るためにデコードされます。 このデコードは、Tarsos Transcoder 1.2によって実現されています。このライブラリは多くのApacheユーティリティを使用しているため、TarsosTranscoder.jarの横にmp3plugin.jarもプロジェクトビルドパスに含める必要があります。

+0

adulazizありがとう。 – Manu

関連する問題