2017-09-08 8 views
-2

重複する画像をディレクトリに見つけるプログラムを作成したいのですが、this appのようなものです.2つの画像が同じかどうかを判断するアルゴリズムはなんですか? ご提案は大歓迎です。重複する画像のアルゴリズムを見つける

+0

「重複」はどのように定義しますか?イメージは同じでなければならないのですか?彼らは異なるサイズを持つことができますか?イメージファイル形式?ファイル属性? –

+0

はい、2つのイメージは異なるサイズと異なるファイル形式を持つことができ、2つのイメージの内容のみが同一になります。 –

答えて

0

このタスクは、あなたのユースケースに応じて、高次元(kd-tree、ball-tree、...)の最近傍検索の原因となるいくつかのデータ構造と組み合わせて、perceptual-hashingで解決できます。ブルートフォース検索(やや)を置き換えます。

DCTベース、ウェーブレットベース、統計ベース、フィーチャベース、CNNなど、さまざまなアプローチがあります。

これらの設計は、通常、タスクに関するさまざまな前提に基づいています。回転が許されるかどうか?

A google scholar search on perceptual image hashingには多くの論文が掲載されます。また、用語の画像フィンガープリンティングを検索することもできます。

Here is some older ugly python/cython code doing the statistics-based approach

備考:Digikamも可能です。私が思うより古いHaar-Waveletベースのアプローチを使っています。

+0

ありがとう!これは非常に役に立ちます。 –

関連する問題