PDF-A 是什么

50 次阅读

本文最后更新于 2026年5月4日。

PDF/A(全称 PDF/Archive,即“用于归档的PDF”)是 ISO 19005 标准定义的、专门为电子文档长期归档保存设计的PDF格式子集。

一、核心目的

确保文档在数十年甚至数百年后,无论使用何种软件、硬件或操作系统,都能完全精确、一致地还原原始的视觉外观和内容。

二、关键特性(与普通PDF的区别)

为实现长期保真,PDF/A 有严格限制:

  1. 完全自包含
    • 所有字体必须嵌入文件(禁止外部字体链接)。
    • 所有颜色信息、ICC配置文件必须内嵌,确保色彩一致。
    • 不依赖任何外部资源(如外部图像、数据流)。
  2. 禁止“不稳定”功能
    • 禁止加密(防止未来无法解密)。
    • 禁止 JavaScript、音频、视频、可执行代码
    • 禁止动态内容、外部链接引用、透明图层(部分版本允许)。
  3. 必须包含元数据
    • 强制嵌入标准的文件描述信息(如标题、作者、创建日期)。

三、主要版本与级别

PDF/A 已发展出多个版本,适用不同场景:

版本 标准 基础 主要特点
PDF/A-1 ISO 19005-1 PDF 1.4 最严格,禁止透明度,分a(可访问)/b(基础)级
PDF/A-2 ISO 19005-2 PDF 1.7 支持透明度、JPEG2000、分层PDF
PDF/A-3 ISO 19005-3 PDF 1.7 在A-2基础上,允许嵌入任意文件(如XML、Excel)
PDF/A-4 ISO 19005-4 PDF 2.0 最新版,基于现代PDF 2.0,简化级别
  • a级 (Accessible):保留文本结构、标签,支持屏幕阅读器,更适合可访问性归档
  • b级 (Basic):仅保证视觉外观一致,档案馆、政府最常用。

四、主要应用场景

  • 政府/档案馆:法律文书、公文、档案永久保存。
  • 法律/金融:合同、发票、保单、银行凭证(防篡改、长期可查)。
  • 出版/图书馆:电子书、期刊、古籍数字化存档。
  • 企业合规:满足审计、法规要求的电子记录留存。

五、总结

PDF ≈ 日常灵活使用;PDF/A ≈ 长期保真归档
如果你需要文件几十年后打开依然一模一样,就用 PDF/A