これはPythonのコード競争で出現した質問であり、これがどのように達成されるのか不思議でした。Pythonを使用して重複ファイルを検索する
問題の声明:
あなたが(それで可能なサブディレクトリとの)2つのディレクトリを持っています。 FAIL:少なくとも1つの同じファイル名の内容は
PASS異なる場合:それ以外の場合は
をここだスクリプトが同じファイル名の内容を2つのルートディレクトリに
の検索結果を比較することにより、重複したファイルを見つける必要がありますサンプル図
/dir1 /dir2
-- file1 -- file1
-- file2 -- fileA
-- file3 -- fileB
-- ....
-- ...
---/subDir1
--file1
--file2
file1 of dir1 contains :- foo bar
file1 of dir2 contains :- foo
Result - Fail
file1 of dir1 contains :- foo bar
file1 of dir2 contains :- foo bar
Result - Pass.
は、私は、ファイルのサイズによってハッシュを使用しようとしましたが、それは明らかではない方法でした:)
PS:任意のスクリプト言語を使用できます。
おかげ ケリー
私は方法を説明しようとしていましたが、完全なプログラムhttp://www.ssokolow.com/scripts/fastdupes.pyにあなたを紹介する方が良いと思います(私はそれを書いていませんでしたが、それを見てみると、それがどのように動作するかを説明しようとするよりも良いでしょう。 –