2017-07-19 26 views
0

pyaudioとpocketsphinxを使用して、コンピュータのマイクを聞いて、私が言っていることを翻訳しています。私が知りたいことは、プログラムが聞いた後に聞くことができれば文章を聞き取り、一時的なWAVファイルの一部を削除して処理するかどうかです。閾値?たとえば、文章を話すと、プログラムは話し終えるのを待ってから、長いブレークを検出すると、聞き取りを止め、wavファイルのデータを単語間のスペースを75%削除してから短縮されたwavファイルをpocketsphinxライブラリに渡して音声認識を行います。私はnumpyとscipyを使用して他の解決策を聞いたことがあるが、そのループは、手動でwavスペクトログラム内のトリムセグメントをマウスで指定する必要がありました。私はコード内でこれを自動的に処理したいと思っています。どんな助けでも大歓迎です!Pythonの内部でwavファイルをトリミングする方法

答えて

1

numpyソリューションとscipyソリューションでは、GUIがない限りユーザーの操作は必要ありません。

>>> from scipy.io.wavfile import read 
>>> a = read("adios.wav") 
>>> numpy.array(a[1],dtype=float) 
array([ 128., 128., 128., ..., 128., 128., 128.]) 

scipy.signal操作のようなもののために多くのビルドイン機能を備えています。

Python: write a wav file into numpy float array

How to manipulate wav file data in Python?

What is the easiest way to read wav-files using Python [summary]?

はすでにこのトピックに関する他の記事があります

関連する問題