複数のMS Officeファイルを共有ドライブからSharePoint(たとえばSharePoint Online)に移行するとします。 Office 2007以降に限定されているため、DOCX、XLSXなどのファイル拡張子があります。メタデータが追加されて以来、SharePointは最初に保存されたときにMS Officeファイルのサイズを変更します。コンテンツが変更されていないことを確認できますか?
特定のメタデータが追加されたときに、ファイルがSharePointに保存されるときにファイルのサイズが変更されることがわかります。 (ただし、PDFやJPEGなどの非MS Officeファイルのファイルサイズは変更されません)。
これらのMS Officeファイルは、いくつかのコンポーネントが置かれた「コンテナ」です。この状況は、XLSXファイルの拡張子(たとえばZIP)を変更してWinZipで開くことによって劇的に見ることができます。
健全な完全性の理由から、「ファイルコンテンツ」コンポーネントの部分は変更されていないことを保証したいと考えています。
コンテンツを表すコンテナ内のコンポーネントパーツはどのように識別できますか? 記述されているようにSharePointに保存した場合、そのようなコンポーネント部分は不変ですか?
もしそうなら、そのようなファイルのペアを分析してコンテンツが同じか、変更されていることを確認できるユーティリティはありますか?おそらく両方のファイルから生成して比較できるチェックサムがありますか?
このようなユーティリティが存在しない場合、どのような環境で作成するのが最適でしょうか? - それはVB.NETやC#で行うことができますか?
ありがとうございました。
この前の投稿は同じ問題に関連していますが、私たちが必要とする回答の種類は提供していません。 C# - Hash contents of MS Office documents without metadata