2009-07-31 6 views
3

私はオーディオ業界で初めて、私はどのように対処するのか分からないタスクを割り当てられました。 WAVファイルのピッチを表すグラフを表示する必要があります。 WAVファイルはポリフォニックなので、支配的な(読んでいる:最も強い音量の)楽器(または人間の声の歌声)のピッチグラフを表示する必要があります。 私は.NETに慣れ親しんでおり、C、C++、Javaでは何も知らない。WAVファイルのピッチを表示

私はウェブでの研究を開始しました。ポリフォニックWAVファイルのピッチ検出が問題ではないと理解していましたが、正確なピッチは必要ありません。その長さは何ですか?

私の質問は以下のとおりです。

  1. 私は、このタスクの背後にある理論を学ぶために開始する必要があり

    ?そのためのお勧めの本はありますか?

  2. これを実行できるAPI /ツールはありますか?

おかげで、

ML

答えて

2

あなたは波の成分の周波数を抽出するためにフーリエ解析を使用することができます。ここに関連する質問があります:Fast Fourier Transform in C#

+1

私は、WAVファイルのポリフォニック性を心配しています。 FFTは、最も支配的な楽器/声を分離するのに役立ちますか? –

+0

Well FFTはwaveの断片の中で優勢な周波数を与えます - もし3つの楽器が中音域を作り出しているなら(FFTは基本周波数か高調波かにかかわらず)、FFTはどの楽器が最も大きな音であるかを教えませんが、その中央のCはサンプルの最も大きな周波数です。 –

+0

私はあなたが 'スペクトラムアナライザ'を見たことを前提としています.FFTはそれをあなたに与えます。 –

0

私はやや関連プロジェクトに取り組んでいます。あなたは高速フーリエ変換を調べたいと思うでしょう。私はこのproject written in C#をお勧めすることができます - それはギターチューナーとして書かれていますが、あなたの目的に簡単に変更することができます。

しかし、これはマルチピッチを行いません。 "celemony"と呼ばれる製品は、 "ダイレクトノートアクセス(DNA)"を使用してこの能力を有すると主張している。彼らの技術は明らかに閉鎖されたソースですが、適切な価格でライセンスを取得することができます。

1

私はDigital Signal Processingで信号処理を開始しました。約$ 30で印刷された本を購入するか、pdfを無料でダウンロードできます。これは科学者以外の人のために書かれたもので、さまざまな信号処理技術を駆使して動かすための豊富な情報が含まれています。

FFT(高速フーリエ変換)は時間対振幅信号を周波数(ビン)と強度(エネルギー)に変換します。あなたは多くのウェブサイトにあるstandard chartsを介して頻度からメモに行くことができます。

関連する問題