我是靠谱客的博主 甜美仙人掌,最近开发中收集的这篇文章主要介绍PDF/A描述,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

什么是PDFA

PDF/A基本上是一种专门为长期数字存档而设计的PDF格式。它结合了PDF格式的优点和长期存档的其他特定要求。PDF/A标准是一组规则,用于定义文档必须满足哪些标准才能符合PDF/A标准。它在范围上比PDF要有限得多,因为PDF本身已经是基础标准

传统的存档方法(纸张、缩微胶片、缩微胶片)在保证再现性的同时,已不再符合最新技术。传统的PDF格式正在急剧下降,因为它们越来越不能满足企业在数字化转型背景下的需求。对于任何给定的存档概念,还必须考虑法律条件、特定于行业的法规和内部指导方针。

许多组织建立TIFF档案作为迈向电子存档的第一步。TIFF格式文件现在可以在全球相连的组织中迅速和容易地传播;然而,搜寻工作仍然困难重重。常规的PDF格式也不能完全满足归档格式的要求,这就是为什么它被用作开发PDF/ a标准的坚实基础。

 PDF和PADA区别

正常的PDF格式不能保证长期的可重复性或完全独立于软件和输出设备。为了保证这两个原则,有必要同时限制和扩展现有的PDF规范。很明显,从一开始,PDF/ a -1必须基于现有的PDF版本,以获得广泛的受众的接受。

ISO TC 171使用Adobe的PDF参考1.4 (acrobat5)作为PDF/A标准(ISO 19005)的基础。它指出PDF/A“必须满足PDF参考文件的所有要求,其中还包括ISO 19005标准的这一部分。

标准只描述了与参考文献的差异。要完全理解PDF/A,也有必要理解PDF参考文献1.4。PDF 1.4支持的某些功能,如透明度或音频/视频复制,被排除在PDF/A中。同时,PDF 1.4包含了PDF/A中必须包含的可选元素。以PDF/A为例,所使用的所有字体都必须嵌入。

简而言之, PDF/A主要定义了PDF参考文献1.4中规定的强制、推荐、限制或禁止的特定属性。

PDFA标准

目标:

SO标准19005定义了一种基于PDF的文件格式,称为PDF/ a。该格式提供了一种表示电子文档的机制,使视觉外观在较长时间内保持不变,不受生产、保存和复制它的工具和系统的影响。

本标准既没有规定保存的方法,也没有规定保存的意图或目的。因此,该标准旨在保证电子文件即使在将来也能以其原始外观查看。因此,文档可能不会间接或直接引用外部源,例如外部图像或未嵌入到文档本身中的字体。

标准:

SO 19005-1文件管理。长期保存的电子文件文件格式。第1部分:PDF 1.4的使用(PDF/A-1)

PDF/A版本

PDF/A-1标准分为两级:PDF/A-1a和PDF/A-1b。PDF/A-1a (A级符合性)定义符合PDF/A-1标准的所有要求。 

第1部分:PDF/A一致性最低要求的描述

载于PDF/A-1b (B级一致性)。PDF/A-1b要求应足以确保视觉和长期复制。

第2部分:ISO 19005-2, part 2 (PDF/A-2)。虽然PDF 1.4版是PDF/A-1的基础,但PDF/A-2提供了只有在后来的PDF版本中才有的有用功能——直到并包括PDF 1.7版。然而,最重要的是,PDF/ a -2不是基于特定版本的Adobe PDF,而是基于ISO 32000-1标准。

第3部分:SO委员会已经批准了标准的第三版(PDF/A-3, ISO 19005-3)。

PDFA的三个一致性

a:语义正确性和结构(带标签的PDF)。存档PDF,包括对所有类型内容的完全可访问性

b:视觉完整——清晰,长期视觉再现静态内容

c: 数码PDF文档和光学字符识别扫描文档的文本检索和Unicode文本复制功能

PDFA1和PDFA2

PDF/A-2不会以任何方式取代或取代PDF/A-1。已创建的PDF/A-1一致性文档将保持长期存档的有效PDF/A文件。存档的PDF/A-1文档可以在存储档案中保持不变,因此“升级”到PDF/A-2是没有必要的。

对于发现PDF/A-2引入的功能很有用的组织,将原始源文档转换为PDF/A-2将会有优势。得益于压缩对象和XRef流,这包括更高的成功转换文档率和更小的文件大小。但同样地,对于那些没有看到PDF/ a -2引入的特性带来好处的组织来说,将源文档转换为PDF/ a -1仍然可以正常工作。- PDF/A-1和PDF/A-2都完全支持PDF文档的长期归档。 

   

PDF/A-2包括许多功能:

JPEG2000压缩:JPEG2000压缩是与PDF 1.5规范一起引入的,该规范超过了PDF/A-1标准的发布时间。添加JPEG2000压缩有利于特定的扫描文档。

 

通过集合嵌入PDF/A文件:

Acrobat允许用户创建集合(有时也称为“作品集”),其中多个PDF/A文档被组合成一个“容器PDF”文档。PDF/A集合的可能用途是,例如,电子邮件附件的存档可以转换为PDF/A,并存储为转换后的PDF/A电子邮件文本主体中的“集合”。PDF/A集合还可以使安全应用程序受益,其中签名可以应用于单个页面。然后,PDF/A集合组合已签名的单页。随后可以删除个别页面,而不影响其余页面签名的有效性然后,PDF/A集合组合已签名的单页。随后可以删除个

别页面,而不影响其余页面签名的有效性

 

透明度:

尽管透明度是PDF 1.4的一部分,但在PDF/A-1标准发布时,它的定义还不够好,无法包含在PDF/A-1标准中。从那时起,规范已经相当成熟,透明度已经成为PDF文档的共同特征。例如,透明度通常以阴影、交叉淡出和高亮贴图的形式出现。

 

可选内容(图层):

可选内容(有时也称为层)对于映射应用程序或工程图纸非常有用,其中各个层可以根据查看人员的信息需求显示或隐藏。另一个有用的地方是在国际销售的产品的用户手册中——不同的语言可以在不同的层上实现。

 

Unicode的新一致性级别PDF/A-2u -“u”:

PDF/A-1b和PDF/A-2b侧重于视觉完整性,其中“b”代表“基本”。PDF/ a -1a和PDF/ a -2a侧重于可访问性,因此使用了“a”符号。PDF/A-2的新特性是一致性级别PDF/A-2u。它简化了数字创建的PDF文档和后续光学识别(OCR)扫描的PDF文档的文本搜索和Unicode文本复制。

  

对象级XMP元数据:

PDF/A-2指定了自定义XMP元数据的要求。

 

注释类型和注释:

一些较新的注释类型被添加到禁止注释类型的列表中,同时一些较新的注释类型,如文本编辑注释现在被PDF/ a -2标准所接受。

 

数字签名:

虽然PDF/A-1已经允许数字签名,但PDF/A-2定义了需要应用的规则以保证互操作性。

PDFA2和PDFA3

PDF/A-3满足了一个重要的用户需求,即嵌入不符合PDF/A标准的文件格式的选项。由于这一修订是可取的,但有争议,它仍然是PDF/A-2标准的唯一变化。因此,用户可以在纯PDF/ a集合和各种标准的混合之间进行选择,由于“PDF/ a -3”标签,这些标准很容易区分。

 

专家中的纯粹主义者认为,这一修正案与PDF/A标准背后的最初想法相矛盾。然而,来自不同领域的公司(如制药行业或银行和金融部门)的实用主义者确实需要将原始文件格式与转换后的PDF/ a文件一起保存。属于一起的文件被编译成一个“集合”。这种结构在PDF/A-2时代就已经为人所知。典型的应用程序包括归档电子邮件及其附件,可以由许多不同的文件格式组成。

 

该标准仅保证通过一致性查看器查看PDF/A文档的表示。不一致的嵌入文档的表示是通过使用支持相关文档格式的工具的单独操作实现的。

仅当您计划嵌入不符合PDF/A标准的文档时才应使用PDF/A-3。PDF/A-2在所有其他情况下都是正确的选择,因为它很清楚地表明没有嵌入其他格式。PDF/A-1对于不需要PDF/A-2提供的所有功能的人来说仍然足够好。不需要迁移现有的存档,因为PDF/ a -3一致性查看器可以显示所有PDF/ a一致性文件

最后

以上就是甜美仙人掌为你收集整理的PDF/A描述的全部内容,希望文章能够帮你解决PDF/A描述所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(55)

评论列表共有 0 条评论

立即
投稿
返回
顶部