2005 年左右,结构化信息标准促进组织Organization for the Advancement of Structured Information Standards(OASIS)为所有类型的办公文档定义了一种开放格式,即办公应用程序开放文档格式Open Document Format for Office Applications(ODF)。由于 ODF 是基于 OpenOffice.org的 XML 文件规范的开放式标准,因此你也可以将其简称为 “开放文档格式”。ODF 包括几种文件类型,包括用于 开放文档文本OpenDocument Text 文档的 ODT。ODT 文件中有很多值得探索的内容,它的本质是一个 Zip 文件。
ODT 文件结构
跟所有 ODF 文件一样,ODT 文件实际上是一个 XML 文档和其它文件的 Zip 压缩包。使用 Zip 可以占用更少的磁盘空间,同时也意味着可以用标准 Zip 工具来检查它。
我有一篇关于 IT 领导力的文章,名为“Nibbled to death by ducks”,我将其保存为 ODT 文件。由于 ODF 文件是一个 zip 容器,你可以用 unzip命令来检查它:
$ unzip -l 'Nibbled to death by ducks.odt'Archive: Nibbled to death by ducks.odtLength Date Time Name39 07-15-2022 22:18 mimetype12713 07-15-2022 22:18 Thumbnails/thumbnail.png915001 07-15-2022 22:18 Pictures/10000201000004500000026DBF6636B0B9352031.png10879 07-15-2022 22:18 content.xml20048 07-15-2022 22:18 styles.xml9576 07-15-2022 22:18 settings.xml757 07-15-2022 22:18 meta.xml260 07-15-2022 22:18 manifest.rdf0 07-15-2022 22:18 Configurations2/accelerator/0 07-15-2022 22:18 Configurations2/toolpanel/0 07-15-2022 22:18 Configurations2/statusbar/0 07-15-2022 22:18 Configurations2/progressbar/0 07-15-2022 22:18 Configurations2/toolbar/0 07-15-2022 22:18 Configurations2/popupmenu/0 07-15-2022 22:18 Configurations2/floater/0 07-15-2022 22:18 Configurations2/menubar/1192 07-15-2022 22:18 META-INF/manifest.xml970465 17 files
我想强调 Zip 文件结构的以下几个元素: