2017-06-11 5 views
3

私は古い音楽(1920年代、30年代、40年代など)の大きなライブラリを持っていて、重複しています。重複を特定し、同じMP3タグ情報で整理したいと思います。音楽はしばらく前に録音されていたため、人間の耳に似た音が聞こえるかもしれませんが、録音は実際には少し違っていました(静かで静かななど)。wavファイルを使って2つの同様の曲を比較することはできますか?

私は現在、pydubを使用して音楽の一部を解析しており、曲の始めと終わりに無音を取り除き、音楽のダイナミックレンジを圧縮できますwavファイルを比較できるように、それらが似ているならば、私はそれらが同じであると仮定して同じタグを与えることができます。

numpyなどのwavファイルデータを実行して、フーリエ変換/ FFTなどのデータを使用してデータを精度よく比較/相関させることはできますか?私はそれがdejavuのようなシステムで行うことができることを知っていますが、それはかなり集中していて、データベースにたくさんのストレージを使用していて、マイクを使うよりも生ファイルにアクセスできるので、 。

+0

[beets](http://beets.io/)または[picard](https://picard.musicbrainz.org/)は、あなたを助け、もっと多くを提供できるはずです。独自のカスタマイズされたものを実装したい場合は、[librosa](https://librosa.github.io/librosa/index.html)がコアになる可能性があります(scipyよりもはるかに特化しています)。 – sascha

答えて

1

audio hashまたはacoustic fingerprintが必要です。オーディオを解凍してデータを抽出する必要があるため、これらのすべてが「集中的」です(リソースが必要です)。

関連する問題