大きなバイナリファイルを内部的に配布しているクライアントがあります。彼らはまた、ファイルのmd5チェックサムを渡しており、ワークフローの一部として使用する前にチェックサムに対してファイルを検証しているようです。md5偽陽性チェックサムはどのくらいありそうですか?
しかし、彼らは、「多くの場合、md5がまだファイルが良好であると言っているファイルで破損が発生していることが多い」と主張しています。
私が読んだことは、これが非常に起こりそうもないことを示唆しています。
これはおそらく聞こえますか?別のハッシュアルゴリズムがより良い結果をもたらすでしょうか?私は実際にチェックサムのチェックを主張するようなプロセスの問題を実際に調べるべきですか?
NBでは、この文脈で「しばしば」が何を意味するのかまだ分かりません。彼らは1日に何百ものファイルを処理しています。これが毎日、毎月、または毎年起こっているかどうかはわかりません。
"壊れた"ファイルと "良い"オリジナルの例を挙げてください。 –
md5の合計が破損ファイルで計算されたか、または合計が計算された後に破損が発生している可能性はありますか?確かに知るには、Anonの提案を取り、同じチェックサムを持つ2つのファイルの例を得てください。 – BMitch
それ以来、ビットトレントの同期の考え方を見てきましたか? getsync.com] – dlamblin