完全を期すために、ここでは私の知るオプションです:
YaafeとlibXtractが、おそらく最も高く、性能の面で最適化されている(ベンチマークを参照してください以下)。それらは両方とも、特徴抽出器間で中間計算を共有する。たとえば、ウィンドウごとに1つのFFTだけを実行し、FFTを必要とする抽出プログラムはそのFFTを参照するだけです。より高いレベルの機能の場合と同じです。言及された他のエクストラクタはプラグインアーキテクチャに依存しているため、実際には行っていません。つまり、各エクストラクタはスタンドアロンである必要があります。
ソニックアノテーターとフレンドはプラグインアーキテクチャの恩恵を受け、あらゆる種類のサードパーティフィーチャーエクストラクタ(libXtract、aubio、Essentiaなど)を楽しむことができます。 Vampプラグインのエコシステムは、実際には非常に多様で素晴らしいものです。 Vamp Plugin SDKにプラグインホストを構築するための完全なサンプルコードがあります。
私はEssentiaについてほとんど知りませんが、それは他よりも新しく、Pompeu Fabraの優れた音楽技術グループのものです。それは、大きくて組織的なプロジェクトのようだ。ドキュメントはとても良いです。彼らは、大規模な音楽分析プロジェクト(FreesoundやAcousticBrainzなど)でそれを使用しています。プロジェクトの焦点は、パフォーマンスと正確さにあるようです。一見の価値がある。
MARSYASはライブラリだけでなく、フレームワーク全体です。ドキュメントはかなり良いです。これは積極的な開発の下にあり、UVicのGeorge Tzanetakisによって定期的に提供されるMOOCの一部です。 MARYSYASを中心に構築されたアプリやプロジェクトがかなりあるようです。
CAMELとMaaateは休眠しているようです - 2010年と2012年のそれぞれから新しいリリースは見られませんでした。
S.A. Marsyas YAAFE
MFCC 1506 1168 142
Centroid 724 942 235
Rolloff 731 951 194
ZCR 221 620 57
Total 3182 3681 628
は、あなたが "機能" とは何を考えていますか? – RedFilter
私が「フィーチャ」と言うとき、私はAIの理論的な定義を指しています。機能とは、オーディオを区別したりグループ化したりするために使用できるメトリックです。例えば、平均値または分散および他の統計的なものは、フィーチャとすることができる。 – esiegel