2012-05-13 17 views
0

私は基本的なコマンド認識を行い、そのためにGoogle Search Input APIを使用しています。しかし、私は自分自身でオーディオをキャプチャし、オーディオ(ノイズ除去、ブースト振幅など)を前処理し、修正されたオーディオをレコグナイザに送り、結果を取得したい。出来ますか?音声を前処理で処理する音声入力認識ツール

と一緒にSpeechRecognizerを使用して、onBufferReceivedメソッドを使用して音声を取得することができます。しかし、私は後処理の代わりに前処理をしたい。処理されたデータをGoogleの認識ツールに送るための回避策やハックはありますか?

答えて

0

前処理、音声(ノイズ除去、ブースト振幅、など)、認識装置にそれらの変更されたオーディオを送信し、取得結果

通常の音声認識システムは、この苦しみます。誤って実装された雑音除去は、予期しない方法でスペクトルを壊すため、音声の認識精度を低下させる可能性があります。振幅認識は、音声認識の最初の段階で振幅が正規化されるため、振幅増幅が役に立たない。あなたの前処理は傷つくだけです。

あなたはまだそれを試してみたい場合は、ノイズ除去と落とし穴についての先端のためのpocketsphinx

http://cmusphinx.sourceforge.net/2011/05/building-pocketsphinx-on-android/

+0

Thxをを試してみてください。私はすでにsphinxをテストしましたが、それは何らかの理由で提供されたアプリでうまく機能しなかったので、私はGoogleの認識ツールを使いたいのです。リバースエンジニアリングのアンドロイドレコグナイザの活動は、前処理を行う唯一の方法ですか? – pzo