私はオーディオ業界で初めて、私はどのように対処するのか分からないタスクを割り当てられました。 WAVファイルのピッチを表すグラフを表示する必要があります。 WAVファイルはポリフォニックなので、支配的な(読んでいる:最も強い音量の)楽器(または人間の声の歌声)のピッチグラフを表示する必要があります。 私は.NETに慣れ親しんでおり、C、C++、Javaでは何も知らない。WAVファイルのピッチを表示
私はウェブでの研究を開始しました。ポリフォニックWAVファイルのピッチ検出が問題ではないと理解していましたが、正確なピッチは必要ありません。その長さは何ですか?
私の質問は以下のとおりです。
- 私は、このタスクの背後にある理論を学ぶために開始する必要があり
?そのためのお勧めの本はありますか?
これを実行できるAPI /ツールはありますか?
おかげで、
ML
私は、WAVファイルのポリフォニック性を心配しています。 FFTは、最も支配的な楽器/声を分離するのに役立ちますか? –
Well FFTはwaveの断片の中で優勢な周波数を与えます - もし3つの楽器が中音域を作り出しているなら(FFTは基本周波数か高調波かにかかわらず)、FFTはどの楽器が最も大きな音であるかを教えませんが、その中央のCはサンプルの最も大きな周波数です。 –
私はあなたが 'スペクトラムアナライザ'を見たことを前提としています.FFTはそれをあなたに与えます。 –