2011-02-06 4 views
15

私はいくつかの古いMicrosoft Wordファイル(おそらくWord 97)をここに置き、標準のUnixファイルユーティリティが "CDF"というファイルを識別していることに気付きました。実際には、詳細なメタデータをダンプします。例えば、ファイルユーティリティがMicrosoft WordファイルをCDFとして識別するのはなぜですか?このCDFとは何ですか?

CDF V2 Document, 
Little Endian, 
Os: Windows, 
Version 4.0, 
Code page: 1252, 
Title: ..., 
Author: ..., 
Template: Normal.dot, 
Last Saved By: ..., 
Revision Number: 1, 
Name of Creating Application: Microsoft Word 8.0, 
Create Time/Date: ..., 
Last Saved Time/Date: ..., 
Number of Pages: 1, 
Number of Words: 95, 
Number of Characters: 542, 
Security: 0 

そのCDFは何を表していますか?メディアファイルのRIFFのような一般的なコンテナ形式ですか?私はウェブ上で有用な何かを見つけることができません。これらのMicrosoft Wordファイルは完全にバイナリなので、「チャネル定義形式」と「複合ドキュメント形式」は明確に意味されません。 Common Data Formatの場合、接続が見つかりません。私は、ファイルutil(FreeBSDに付属しているバージョン)のソースコードに何かを見つけようとしましたが、このフォーマットを扱う専用のreadcdf.cがあることがわかりました。

答えて

16

Compound Documents formatは、OLE/COMに関連しています。これは、Word文書などのExcelチャートなどのオブジェクトのリンクと埋め込みを指します。

履歴(以前のXML)document specifications for MS Officeを参照してください。特定のファイル形式の説明は「Windows複合バイナリファイル形式仕様」です。

+0

実際には「複合文書フォーマット」を意味し、に記載されているものではありません。 –

関連する問題