2012-07-13 36 views
5

パブリックデータセットの音楽ジャンルアルゴリズムをテストして、他の既存のアルゴリズムと比較したいと考えています。 MIREXの場合、すべてのデータは利用できません。 GTZANデータセットがリンク(marsyas.info/download/data_sets)で利用可能であることがわかりました しかし、今は私には利用できません。GTZAN音楽ジャンルデータセット

このデータはどのように入手できますか?私はMFCC以外の機能を使用しているので、音楽と同様にジャンルアノテーションが必要です。

ありがとうございます。

答えて

1

私はこのようなベンチマークも探しています。
私はと呼ばれる紙でこれを見つける「音に 『センス』から特徴抽出と機械学習を経て - 特徴付けの音楽のためのハイレベル記述子の導出」:

現在、音楽で行われているいくつかの努力があります。 情報収集コミュニティ の大きなリポジトリをコンパイルして、関心のあるすべての研究者に利用可能にすることができます。 著作権の問題はありません。注目すべき例は、Masataka 後藤のRWC音楽データベース(http://staff.aist.go.jp/m.goto/RWC-MDB)、 IMIRSEL(国際音楽情報検索システム評価 研究室)プロジェクトです。イリノイ大学アーバナシャンペーン校 (http://www.music-ir.org/evaluation-も参照してください[12])、新しい FreeSound Initiative(http://freesound.iua.upf.edu) 。

しかし、私はそれらから有用なものを見つけることができませんでした。最初に言及したデータベースのコピーを取得する手順はhereですが、かなり洗練されたようです!

1

Million Songs Datasetは、EchonestとLabrosaがリリースした、オーディオ機能、タグ、歌詞などを含む100万曲を収録しています。もちろん、これはあなたが音楽のメタデータとトランスクリプトから作業していることを前提としています。

生のオーディオを探している場合は...それは別の問題です。あなたが出版したいかどうかわかりません。その場合、知的財産法はもっと重要な要素かもしれません。しかし私的なテストのために、私は自分の音楽ライブラリのファイルを使うことができると考えています(例えば、iTunesのダウンロードでは、あなたのアルゴリズムをテストするためのジャンルタグが既にあります)。

免責事項:私は弁護士ではありません。あなた自身のリスクで私の法的助言を受けてください。

+0

私はMSDに歌詞がないと思います。 – pratnala

6

EDIT:Marsyasページはmarsyasweb.appspot.comでホストされており、data setsサブページにGTZANデータベースへのリンクがあります。

大学のプロジェクトのGTZANデータセットも探していましたが、http://marsyas.infoがダウンしていることがわかりましたので、google web cache for marsyas.info/download/data_sets(詳しい情報を確認してください)を使用しました。幸いにも、GTZANデータセットはhttp://opihi.cs.uvic.caでホストされ、download themにアクセスできます!

しかし、(キャッシュされたマルシュアスからの情報がページをダウンロード)データセット を使用する前に、ライセンスの点に注意してください。

このデータセットは、Gでジャンル分類「のオーディオ信号の音楽ジャンル分類」でよく知られた紙を使用しましたTzanetakisおよびP.音声と音声処理に関するIEEEトランザクションの料理2002.

残念ながら、私の研究ではデータベースが徐々に早く収集されていたので、タイトルはありません(もちろん著作権の許可などはありません)。これらのファイルは、様々な記録条件を表現するために、個人CD、ラジオ、マイク録音などのさまざまなソースから2000年から2001年に収集されました。 Nevetheless私は、主に比較目的などのために研究者に提供しています。このデータセットを使用して実験結果を公開する場合は、George Tzanetakis([email protected])にお問い合わせください。

データセットは、30秒ごとに1000個のオーディオトラックで構成されています。それは100のトラックによってそれぞれ表される10のジャンルを含んでいる。トラックはすべて.wav形式の22050Hzモノラル16ビットオーディオファイルです。

また、Magnatagatune-http://tagatune.org/Magnatagatune.htmlなどの他のデータセットにも興味があります。