2010-12-13 16 views
8

私が達成しようとしているのは、次のとおりです。分析のためにサウンドファイル(.wav)の周波数値が必要です。私はプログラムの多くが値の視覚的なグラフ(スペクトログラム)を与えるが、私は生データにする必要があることを知っている。私はこれがFFTでできることを知っていて、Pythonではかなり容易にスクリプト化できるはずですが、それを正確に行う方法はわかりません。 ファイルの信号が.4sであるとしましょう。次に、プログラムが測定した各タイムポイントとその値(周波数)とそれに対応する電力(dB)の出力を配列として出力します。複雑なことは、私が鳥の歌を分析したいと思うことであり、それらはしばしば高調波を有するか、または信号が周波数の範囲(例えば1000〜2000Hz)を超えている。私はこの情報も出力したいと思っています。なぜなら、これはデータと一緒にやりたいと思っている分析のために重要だからです:)サウンドファイルからの周波数検出

今、私の望みどおりに見えるコードがあります。私が望むすべての価値を私に与えてくれないと思う。(これを別の質問に投稿したジャスティン・ピールのおかげで:))だから、私は貧弱なピウディオが必要だということを集めるが、残念ながら私はパイソンに慣れていない。 Pythonのエキスパートが私を助けてくれることを願っていますか?

ソースコード:

# Read in a WAV and find the freq's 
import pyaudio 
import wave 
import numpy as np 

chunk = 2048 

# open up a wave 
wf = wave.open('test-tones/440hz.wav', 'rb') 
swidth = wf.getsampwidth() 
RATE = wf.getframerate() 
# use a Blackman window 
window = np.blackman(chunk) 
# open stream 
p = pyaudio.PyAudio() 
stream = p.open(format = 
       p.get_format_from_width(wf.getsampwidth()), 
       channels = wf.getnchannels(), 
       rate = RATE, 
       output = True) 

# read some data 
data = wf.readframes(chunk) 
# play stream and find the frequency of each chunk 
while len(data) == chunk*swidth: 
    # write data out to the audio stream 
    stream.write(data) 
    # unpack the data and times by the hamming window 
    indata = np.array(wave.struct.unpack("%dh"%(len(data)/swidth),\ 
             data))*window 
    # Take the fft and square each value 
    fftData=abs(np.fft.rfft(indata))**2 
    # find the maximum 
    which = fftData[1:].argmax() + 1 
    # use quadratic interpolation around the max 
    if which != len(fftData)-1: 
     y0,y1,y2 = np.log(fftData[which-1:which+2:]) 
     x1 = (y2 - y0) * .5/(2 * y1 - y2 - y0) 
     # find the frequency and output it 
     thefreq = (which+x1)*RATE/chunk 
     print "The freq is %f Hz." % (thefreq) 
    else: 
     thefreq = which*RATE/chunk 
     print "The freq is %f Hz." % (thefreq) 
    # read some more data 
    data = wf.readframes(chunk) 
if data: 
    stream.write(data) 
stream.close() 
p.terminate() 
+3

まだ「検索」を試しましたか?この質問は尋ねられました。たとえば、http://stackoverflow.com/questions/2648151/python-frequency-detection –

+1

はい、これは過去2週間でこの質問が少なくとも5回目です。 – Brad

+0

はい私は検索して周りを見回しましたが、必要な正確な答えを見つけられませんでした。しかし、さらに検索している間、誰かがこの質問を読んで似たようなことをしようとしているなら、私は自由に答えてくれるプログラム:sound analysis proを見つけました。あなたはExcelまたはmatlabにエクスポートされたこのプログラムでデータ(周波数など)を得ることができます! –

答えて

8

あなただけのFFTをしたい場合、私は、これはあなたが望むものであるかどうかわからないんだけど:

import scikits.audiolab, scipy 
x, fs, nbits = scikits.audiolab.wavread(filename) 
X = scipy.fft(x) 

あなたは、振幅応答する場合:

import pylab 
Xdb = 20*scipy.log10(scipy.absolute(X)) 
f = scipy.linspace(0, fs, len(Xdb)) 
pylab.plot(f, Xdb) 
pylab.show() 
+0

私はこれを動作させるが、モノラルサウンドファイルのみにする。ステレオは問題のようです –

+0

'x'の代わりに' 'x::、0 ''を使います。 –

+1

この出力を与えるX値の印刷 '[-1.15917969 + 0.j -0.06542969 + 0.j -0.06542969 + 0.j ...、-0.06542969 + 0.j -0.06542969 + 0.j -0.06542969 + 0 .j] 'しかし、私はただ一つの周波数を得るべきですよね?周波数はどこですか – AQU

5

あなたがする必要があるのはShort-time Fourier Transform(STFT)です。基本的には、複数の部分的に重なり合うFFTを実行し、それぞれの時点でそれらを加算します。次に、各時点のピークを見つけます。私はこれを自分でやったわけではありませんが、過去にいくつか調べてきましたが、これは確実に前進する方法です。

STFT herehereを実行するPythonコードがあります。

+0

ありがとう! 2番目のリンクは間違いなく必要なもののように見えます。私はこれを試してみよう! –