2009-08-15 4 views
4

最近私のiPhoneにShazam appを使い始めました。知らない人のために、このアプリは、曲の小さな部分を聞いて曲を識別します。私はそれが正確さとスピードに驚いていたので、少し掘り下げることにしました。オーディオファイルからデータを抽出するのに適したライブラリは何ですか?

自分の開発者の1人が書いた論文を見つけましたhere。この論文では、開発者はShazamで使用されている指紋アルゴリズムを説明する詳細な詳細情報に入ります。

ペットプロジェクトでは、自分の歌のフィンガープリンティングアプリケーションを作成したいので、オーディオプログラミングに関する経験を得ることができます。

オーディオクリップやmp3曲の周波数、振幅、その他の特性を抽出するのに役立つオーディオライブラリとは何ですか?

私は.NETを使用していますが、私は他の言語ライブラリにも対応しています。私は、オープンソースと有料の両方のライブラリでもうまくいきます。私が確実に音の特徴を確実に抽出できる限り、私は満足しています。
How Shazam Works
Shazam Journal Paper

+1

素晴らしい記事、ありがとうございます。私はいつもシャザムがどのように働いているのか疑問に思っていました。私はFFTや他のDSPを含むC#で多くのオーディオプログラミングを行います。私はあなたにこれを手伝ってくれることに興味があります。私のプロフィールのウェブサイトから私に連絡することができます。 – MusiGenesis

答えて

-1

ffmpegライブラリは、オーディオコーデックの多くをサポートしていますが、それは私見とインタフェースするためにかなりの痛みです:

も参照してください。

オーディオプロパティを抽出するには、信号解析に適した適切なライブラリを検討する必要があります。特に、オーディオサンプルから周波数データを抽出するには、高速フーリエ変換(FTT)が必要です。 A searchは、そのトピックについて多くの結果を得ています。

/edit:.NETの場合、私はffmpegインターフェイスがあると確信しています。 .NET用のシグナル解析ツールもあります。

+0

彼が探しているものは、「オーディオ機能」または「オーディオ記述子」と呼ばれるものを抽出するためのツールボックスです。オーディオ記述子の設計は、「音楽情報検索」という名前の研究分野の一部です。 – lizzie

2

NAudioをご覧ください。あなたの前で探しているすべてのオーディオ分析を持っているわけではありませんが、拡張性があり、.Net言語を使用している場合は、開始するのに適しています。

+0

合意。 NAudioは始めるのに適した場所です。 – Noldorin

0

オーディオ機能を使用するには、まずthis paperを読んでください。

多くのラボでは、オーディオ機能を抽出する独自のライブラリを開発しています。 yafee、aubio、jaudioを見ることができます....

+1

この回答を投票した人からのコメントがありましたらうれしいです。 – lizzie

+1

+1 - 私たちの質問/回答をフィードバックなしで下さっている人を見て苛立っています。どのように私たちのQn/Ansを改善することができます(私はあなたにdownvoteをしなかった) –

+0

最悪のこれは私の答えをdownvoted私の答えをdownvotedです...しかし、少なくとも私はなぜ私は答えは充当されていません! – lizzie

関連する問題