ディレクトリから重複ファイルを取得するにはどうすればよいですか?私はファイルのバージョン番号を無視したい。シェル内のディレクトリから重複ファイルを取得する
directory
httpcore-4.3.jar
httpcore.jar
http.jar
私はhttpcore
をお返しします。 私は考えることができる最も簡単な方法は、
allfiles <-- readAllFileNames()
for file1 in allfiles
for file2 in allfiles
compare file1 and file2 by ignoring version
は、いずれかが別の効率的な方法がありますか?
"重複"を "名前からバージョン番号を削除した場合、同じ名前になる複数のファイル"と定義していますか?どのようにバージョン番号を定義していますか?バージョンナンバリングスキームがたくさんあり、 '4.3'のために働くものは必ずしも' 4.3.1'や '4.3rc1'などを捕まえるものではありません。 –
名前からバージョン番号を削除した場合、同じ名前になりますか? " →はい。私はあなたが言及したかなり標準バージョン番号を扱っています。 – sattu
各ファイルのチェックサムを一度生成する - 重複するチェックサムを見つける。 –