GB/T37688-2019

信息技术流式文档互操作性的度量

Informationtechnology—Measurementofre-flowabledocumentinteroperability

本文分享国家标准信息技术流式文档互操作性的度量的全文阅读和高清PDF的下载,信息技术流式文档互操作性的度量的编号:GB/T37688-2019。信息技术流式文档互操作性的度量共有13页,发布于2020-03-01
  • 中国标准分类号(CCS)L76
  • 国际标准分类号(ICS)35.240.20
  • 实施日期2020-03-01
  • 文件格式PDF
  • 文本页数13页
  • 文件大小1.32M

信息技术流式文档互操作性的度量


国家标准 GB/T37688一2019 信息技术流式文档互操作性的度量 Informationtechnology一Measuremenofre-flowable documentinteroperability 2019-08-30发布 2020-03-01实施 国家市场监督管理总局 发布 币国国家标准化管理委员会国家标准
GB/T37688一2019 次 目 前言 范围 2 术语和定义、缩略语 文档互操作性分类 互操作性度量模型 互操作性度量方法 互操作性度量的应用 附录A资料性附录模型应用的例子 参考文献
GB/37688一2019 前 言 本标准按照GB/T1.1一2009给出的规则起草 请注意本文件的某些内容可能涉及专利 本文件的发布机构不承担识别这些专利的责任 本标准由全国信息技术标准化技术委员会(SAC/TC28)提出并归口 本标准起草单位:北京信息科技大学,电子技术标准化研究院、北京金山办公软件有限公司、永 中软件股份有限公司、中标软件有限公司、航天福斯软件(北京)有限公司 本标准主要起草人:侯霞、李宁,吴新松方春燕、张展新、冯辉、王耀,谈辉、陈文
GB/37688一2019 信息技术流式文档互操作性的度量 范围 本标准规定了度量流式文档互操作性所使用的模型结构和方法 本标准适用于流式文档的编写者和使用者在文档生存周期中对文档的创建、编辑、修改和评阅等 活动 术语和定义、缩略语 2.1术语和定义 下列术语和定义适用于本文件 2.1.1 流式文档re-flowabledoeument 用于编辑的文档在显现时采用流式灌排的方式动态计算版面 2.1.2 功能点feature 文档格式的功能单元,是构成文档的基本要素 2.1.3 文档格式doeumentformat 文档内容与显现式样的组织形式 2.1.4 文档实例doeumeninstanee 某个具体的,包含若干功能点的文档,用以区别对文档的统称 2.1.5 文档系统documentsstem 由若干功能点组成的系统 2.1.6 功能点的重要度degreeofimportaee 功能点在文档使用中的重要程度 2.1.7 功能点的可转换度degreeoftranslation 功能点从一种文档格式描述转换为另一种文档格式描述的难易程度 2.1.8 文档互操作性documentinteroperability -种文档系统从一种文档格式描述转换为另一种文档格式描述的能力 2.2缩略语 下列缩略语适用于本文件
GB/T37688一2019 D功能点的重要度(Degreeoflmportanee) DT;功能点的可转换度(DegreeofTransformability) ODF:面向办公应用的开放文档格式(OpenDocumentFormatforOfficeApplications 0OXML;开放办公文档XML格式(OfficeOpenXMLFileFormats) UOF;统一办公文档格式(UniformOfficeDocumentFormat 3 文档互操作性分类 3.1概述 功能点的概念是抽象的,但是具体存在时一定是基于某种文档格式描述的,因此在评价文档互操作 性时一定与文档格式相关 功能点从一种文档格式A转换到文档格式B的互操作性并不一定等同于 从B转换到A的互操作性,因此互操作性是有方向性的 文档互操作性是以所涉及的功能点的互操作性为基础的,其实质是一个功能点集合从一个文档格 式转换到另一种文档格式的能力 文档格式和文档实例都是由功能点集合组成的,都属于文档系统 文档互操作性可以再做细分,分 为文档格式的互操作性和文档实例的互操作性 3.2文档格式的互操作性 目前已经发布了多种流式文档格式标准,例如UOF,OOXML、ODF等 这些文档格式标准中定 义的功能点和文档结构都不完全相同,因此两个标准之间不能形成100%的功能点映射 文档格式间的互操作性主要是指一种文档格式的所有功能点转换到另外一种格式上的能力,是对 文档格式整体互操作性的一种描述,是固定的 3.3文档实例的互操作性 个文档实例只包含若干功能点,即由一个功能点集合构成 文档实例可以采用不同的文档格式 予以描述,每个功能点在不同文档格式中的描述方式都不一样 文档实例间的互操作性是指一个采用特定文档格式描述的文档实例转换到另一种文档格式描述的 能力 文档实例的互操作性是由其功能点集合决定的 由于每个功能点在不同格式间的映射能力不 同,因此不同文档实例的互操作性会存在差异,甚至差异很大 互操作性度量模型 4. 概述 互操作性度量模型包含概念层和参数层,具体说明见5.2和5.3 概念层描述文档中功能点的概念 及其相互关系,参数层中包含多种参数,分别用于描述功能点在特定文档格式中的映射位置,功能点的 重要度,以及功能点的可转换度等互操作性度量需要使用的信息 以文字处理为例,度量模型的示意图 如图1所示
GB/37688一2019 字处理 文档 整体-部分 元数据 章节 ----- 作者 段落 表格 标题 概含层 功能点映射 “功能点映射 互操作参数 互操作参数 参数层 t?=*=e 0.7" 0.3 0.3 0,7 功能点可转换度 功能点重要度 UO oD nul 图1文档互操作性度量模型 4.2概念层 概念层中的概念体系表示为节点和边糊成的树狠结构 节点为文档功能点 例如,段常 Paragraph)和句(Run) 边表示概念之间的关联 一般为整体-部分(wholepart)关联 例如,图1中 概念层的节点表示功能点;实线表示“整体-部分”关系,用于描述文档中各功能点之间的层次关系 其 中,功能点“文字处理文档”(word)包含子功能点“元数据”Metadata)、“章节”Seetion)等;功能点“元 数据”包含子功能点“题目”Title)和“作者”Author)等;功能点“章节”包含子功能点“段落” Paragraph)和“表格”(Table)等 可以根据需要引人其他的关联类型 个完整的概念层应包含元数据,文字处理文档,电子表格文档和演示文稿文档几部分 也可以根 据需要只构建文字处理、电子表格或演示文稿的概念层,但应有元数据部分 4.3参数层 4.3.1概述 参数层描述用于度量文档互操作性的信息 模型中只为概念层中树的叶节点指定资源信息 参数 按照其描述信息的用途分为两类 映射参数;描述概念层中底层功能点与具体文档格式的映射关系 详细说明见4.3.2. b度量参数:描述用于度量互操作性的参数,采用数值形式描述 详细说明见4.3.3和4.3.4 4.3.2映射参数 映射参数用于描述功能点在某个文档格式中所映射元素或属性的位置信息,包含以下三个属性
GB/T37688一2019 所属类型Type);表示特定的文档格式,如Type=“U(OF”、Type=“oOXML”或Type= “(ODF” 位置(L.ocation)表示该功能点在所指定的文档格式中所处的物理文件 对于文档格式不支 持的功能点,“位置”可用nul表示 值(Value):表示功能点在所处的物理文件中所映射的元素或属性的具体位置 对于采用 XMI描述的文档格式而言,参数值宜用XPath来描述,即功能点所对应元素或属性)的 XPath 大多数文档格式都采用了打包的形式,即一个文档由若干物理文件组成 此时,“位置”用来指定功 能点对应的元素(或属性)所属物理文件在包中的相对位置及文件名 例如,对于图1中功能点“作者” 当 Type=“UOF”时,L.ocation=“ /-_meta/mtea.xml”,Value=“/元;元数据_5200/元作者_5204”,说 明该功能点在UoF格式中,位于物理文件“mtea.xml”,功能点对应元素的XPath为“/元;元数据 5200/元;作者_5204” 对于仅采用单文件而不采用打包形式的文档格式而言,L.ocation=“" 4.3.3功能点的重要度 功能点的重要度(D)的赋值方法应采用如下三种方法之一 基于人工评价的三级 a 由领域专家对功能点的重要度进行评价,分为三级,其中 -3级:指流式文档必备的功能点,量化为数值1 2级:指流式文档常用的功能点,量化为数值0.6 1级;指流式文档中很少用到的功能点,量化为数值0.3. 例如.表A.1中“D(f,)”列即采用三级赋值的方法 D)基于大量的文档实例进行统计,利用功能点的使用频度来评价D值,使用频度越高的功能点 D值越大 设文档集合为D,共包含N个文档实例 功能点,的D值为该功能点在所有样本文档中出现的 总次数与样本文档中所有功能点出现的总次数之和的比值 具体描述如式(1) 此方法评估出的D值 反映的是功能点使用频率的整体情况 >N, (f,= 习 其中,N()表示功能点在样本文档d中出现的次数 基于一个特定的文档实例,利用功能点的使用频度来评价DI值 c 在一个特定的文档实例中,某个功能点的使用情况可能会与方法b)得出的DI值存在矛盾 例如 对于功能点f和f.,利用式(1)得出的结果为p(f)>(f),即功能点f的重要度比,高 但是 在文档实例d中,f并没有被用到,而 出现了很多次 很显然,针对文档d,通过方法)获得的 D值并不能体现功能点在d中的重要度 此时,宜采用公式(2)的方法计算D值 即功能点f在特 定文档d,中的重要度为:该功能点在d,中出现的次数与d,中所有功能点出现次数总和之比 N( p(i,d))=- N,(. 习 在方法b)和方法c)中,功能点的重要度(DI)根据该功能点的使用频度确定 重要度D的取值在 [0.1]区间之内,其中 [O,0.3]区间内表示该功能点很少使用; (0.3,0.6]区间内表示常用功能点; 0.6,l.0]区间内表示必备的功能点
GB/37688一2019 4.3.4功能点的可转换度 功能点的可转换度(Dr)使用类型和值两个属性来描述 -类型(Type);形式是“A2B”,表示由格式A转换到格式B: 值(Value);取值为范围为[o,1] 其中,[o,0.3]表示该功能点无法转换或很难转换,(0.3,0.6 表示转换难度中等,(o.6,l.0]表示容易转换 功能点的可转换度体现的是功能点的互操作性,是文档格式和文档实例互操作性的基础 功能点 的可转换度主要由领域专家进行评价,分为三级 容易转换;一个功能点从格式A转换到格式B时,信息可以完全保留; 中等难度;一个功能点从格式A转换到格式B时,信息可以保留大部分; 难以转换:一个功能点从格式A转换到格式B时,信息难以保留或无法映射 为了便于互操作度量的量化评价,将容易转换中等难度和难以转换分别标记为数值1,0.6和0.3, 用于描述功能点的DT值 例如,表A.1中“DTooxu2or(f,)”列给出的是功能点从OOXML转换到 ODF的可转换度 5 互操作性度量方法 5.1互操作性的分级度量 文档系统互操作性采用分级的方式进行度量,分为三个级别 a)互操作性良好 当文档系统从格式A转换到格式B时,文档系统中的所有或绝大部分功能点在A中的描述都在B 中都存在相应的描述,使得文档的内容和式样信息在转换的过程中不会或基本不会产生损失,认为该文 档系统的互操作性良好 此类文档系统中,很多的功能点在A中的描述都能在B中存在简单的一对一映射或一对多映射 D)互操作性一般 当文档系统从格式A转换到格式B时,文档系统中的功能点在两种格式中都有类似地描述,使得 文档的内容和式样信息在转换的过程中产生部分损失,或者信息虽然能够保留但是映射关系复杂,此时 认为该文档系统的互操作性一般 此类文档系统中,功能点不能简单地进行一对一映射或一对多映射,会存在A中的n个功能点与 B中的m个功能点映射的情况,转换方式较为复杂 互操作性差 当文档系统从格式A转换到格式B时,存在部分功能点难以转换,导致转换后丢失的信息量较多, 认为该文档系统的互操作性差 此类文档系统中,最差的情况是A中支持的功能点在B中不支持 5.2互操作性的量化度量 根据度量模型中的参数,一个文档系统从格式A转换到格式B的互操作性可通过量化的方式进行 度量 量化评价互操作性时,应综合考虑文档系统涉及的功能点集合,对其中所有功能点的重要度Dn 和可转换度DT之积求和,然后除以功能点的总数,以这个均值来衡量该文档系统的互操作性 互操作 性度量见式(3): Sn w)DTn( , nterop(A.B)-
GB/T37688一2019 式中 -T是以格式A描述的文档系统用到的功能点集合 lTA|为TA中功能点的总数量,|TA|>0 -t心是T的第i个功能点; DI(tN)为4.3.3中所述功能点/的重要度; DTn(o)是指从格式A转换到格式B时,功能点t的可转换度,详细说明见4.3.4 lnterop(A,B)的值在[0,1]区间内,值越大表示该文档系统的互操作性越好 在无法直接度量两个文档实例如A,C)的互操作性时,可以度量经由中间格式的互操作性 即 当已知Int (A,B)和Interop(B,C)时,Interop( (A,C)=Interop(A,B)×Int nterop(B,C) terop 将TA替换成文档格式标准A涉及的所有功能点集合时,式(3)可以计算两种文档格式标准之间的 互操作性 o 互操作性度量的应用 文档应用中可以根据需要设定互操作性的阂值 当互操作性小于阔值时,应该调整文档实例中互 操作性差的功能点代之以互操作性较好的功能点,以提高文档整体的互操作性 附录A给出了2个 使用互操作度量模型的应用案例
GB/37688一2019 附 录 A 资料性附录 模型应用的例子 A.1初始格式为o0XMI的模型应用的例子 本部分给出一个例子,说明如何使用互操作度量模型 假设用户用0OXML格式写一个文档如 图A.1所示),其他用户使用支持ODF格式的文档编辑器打开它 实际上,用户可以使用OOXML中 的不同功能点集合来设计一些看起来相同的文档 但这些文档从OOXML到ODF的互操作性却不尽 相同 用户应该使用互操作性高的文档,以便于信息交换 遥知 各单仿负责人 请于2016年12月1口14.00参加年终汇报会 秘书处 2016-12-20 图A.1一个实例文档的视图 假设已建立好一个文档互操作性度量模型 基于该度量模型,用户可以根据度量结果从多个备选 方案中选择互操作性高的文档 例如,用户设计了两个文档,分别称为实例1和实例2,它们使用的功能点集合不同,如表A.1所 示 表中各项说明为: -“功能点f”列:度量模型中的功能点名称 “0OXML”列:指明oOXML格式是否支持功能点fi “1”表示“支持”,“o0”表示不支持 在 “ODF列”中类似,指明ODF格式是否支持该功能点 “实例1”列;指明实例1中是否使用了功能点fi “1”表示“使用”,“0”表示未使用 “实例2” 列类似,指明实例2中是否使用了该功能点 “DT ToxwMn.or(f)”列给出功能点从格式OOXML转换到格式ODF时,功能点的DT值 “DI(f,)”列:给出功能点f的D值 度量参数DTooxwnonrf)和D(f)在模型参数层中的描述见4.3.3和4.3.4,具体的赋值见表A.1 的“DTwxnne(f,)”列和“DI(f)”列,其中DT的取值参考IsO/IECPDTR29166 使用式(1)分别度量文档实例1和实例2的互操作性,Interop(0OXMl,ODF)值的计算结果为;实 例1为0.907,实例2为0.926 由此可知,实例2的互操作性较高 其主要差异在于,对于“通知”下面
GB/T37688一2019 的横线,实例1使用功能点“句边框”而实例2使用功能点“段落边框”,DTwxne(段落边框)> DTow.句边框) 因此,基于互操作度量模型可以设计互操作性更好文档模版和文档实例 文档格式与实例的互操作信息 表A.1 O(XMI 序号 功能点 D D() 实例2 ODF TwxM2on#(f 实例1 元数据 摘要 字符数 元数据 0.6 元数据 创建日期 元数据 创建应用 元数据 编辑时间 元数据 编辑次数 元数据 关键词 DocTemple 元数据 页数 0.3 10 元数据 主题 11 元数据 标题 12 元数据 词数 0.3 13 元数据 段落数 段落首行缩进值 l4 5 段落自动行高值 0.3 6 段落固定行高值 17 段后绝对值 18 段后相对值 0.3 19 段落边框 0.6 20 段落缩进绝对值 段前绝对值 21 22 段前相对值 0.3 23 页面上边距 24 页面下边距 25 页面右边距 26 页面左边距 27 句边框 0.3 0.3 28 段落文本对齐 0,6 段落文本加黑 29 A.2初始格式为UoF的模型应用的例子 本部分的例子用于说明互操作度量模型的应用 假设用户用UOF格式生成一个实例文档(如图
GB/37688一2019 A.2所示),对该文档抽取功能点集合,然后分别计算该文档是从UOF到OoOXML的互操性Sim UoF,OoOXML)和从UOF到ODF的互操性Sim(UOF,ODF) 其度量方法和过程与A.1类似,经过 计算得出 Sim(UOF,OOXML)=0.98 Sim(UOF,ODF)=0.84 Intr0(dicti0n Helloeveryone.(Goodmorning.IamGiaoYuweifromChina.IfyouthinkthepronuneiationofHOUislittlediffieult YoucancallmeHelen,myEnglhshname Table1DataofthefeatuwresintheFDM OOXM叫ODE02oDF:ODF20oD Feature TopMargin EditTimes cTemple ParagraphBefore Absolute CrceatedByAp四 BotomMrg 图A.2一个oF实例文档的视图 从互操性度量结果可以得出该实例文档到另外两种格式的互操性存在差异 为了分析互操性差 异,本部分给出一些关于互操性参数的统计数据 本实例文档中涉及的功能点个数为41个,关于D值 和DT值的统计数据如表A.2和表A.3所示 表A.2文档实例中功能点D值的统计 统计数据 DT值为1 DT值为0.6 DT值为0.3 功能点个数 34 表A.3文档实例中功能点值的分段统计 D值为1的功能点个数 DT值为0.的功能点个数DT值为0.3的功能点个数 统计数据 UuoF20(oXML 40 UoF2oDF 27 为了更深人分析文档实例互操作性的差异,可以进一步分析DT值较低的功能点有哪些 在生成 文档实例时,尽量避免使用这些功能点,而是使用一些可以达到类型编辑目标而DT值较高的功能点进 行替代,从而保证文档互操作性
GB/T37688一2019 考文献 参 tehnogy-Open [1]IsO/IEC26300信息技术面向办公应用的开放文档格式(Inf formation DocumentFormatforOHieeApplieations) IsO/IEC29500信息技术文档描述与处理语言开放办公文档XML格式(Informati atio1n tehnology -OffieeOpenXMILFileFon ormats -Documentdescriptionandprocessinglanguages- [3]IsO/IECPDTR29166信息技术文档描述与处理语言ODF/OOXML.转换指南(Inr OpenDocumentFormat/Of formationtechnologyDoeumentdeseriptionandproeessinglanguages ficeOpenXMLTranslationGuidelines 0

了解GB/T37688-2019标准:信息技术流式文档互操作性的度量

随着数字化时代的到来,越来越多的企业和个人将其所有的文件都转换成了电子文档。然而,这些文档可能存在诸多的问题,如不同的格式,不同的元数据等,这些问题造成了文档之间的互操作性差。因此,信息技术领域需要一种用于衡量流式文档互操作性的标准。

GB/T37688-2019标准旨在为流式文档的互操作性提供度量方法,并为文档的交换和归档提供支持。该标准包含了多个方面,如文档格式、元数据、内容结构等。使用GB/T37688-2019标准可以有效地帮助用户在不同平台之间分享和交换文档,提高文档的互操作性。

在GB/T37688-2019标准中,文档格式是其中一个重要的方面。文档格式可以影响文档的结构、内容和外观等方面,因此需要规定统一的格式标准。标准中规定了常见的流式文档格式,如PDF、HTML、XML等,并对这些格式进行了详细的描述。

此外,GB/T37688-2019标准还规定了元数据的标准,包括标题、作者、主题等信息。这些元数据不仅可以为文档提供更多的信息,还可以帮助用户更好地管理文档和搜索文档。

最后,GB/T37688-2019标准还关注了文档的内容结构。文档的内容结构可以影响文档的可读性和可访问性,因此需要进行规范化。标准中规定了适用于各种文档类型的内容结构,如段落、列表、表格等。

总之,GB/T37688-2019标准为信息技术领域中的流式文档互操作性提供了度量方法和支持。通过遵守该标准,用户可以在不同的平台上分享和交换文档,提高文档的互操作性。

信息技术流式文档互操作性的度量的相关资料

和信息技术流式文档互操作性的度量类似的标准

可编程逻辑器件软件安全性设计指南
上一篇 本文分享国家标准可编程逻辑器件软件安全性设计指南的全文阅读和高清PDF的下载,可编程逻辑器件软件安全性设计指南的编号:GB/T37691-2019。可编程逻辑器件软件安全性设计指南共有22页,发布于2020-03-01
军民通用资源信息分类与编码编制要求
本文分享国家标准军民通用资源信息分类与编码编制要求的全文阅读和高清PDF的下载,军民通用资源信息分类与编码编制要求的编号:GB/T37936-2019。军民通用资源信息分类与编码编制要求共有15页,发布于2020-03-01 下一篇
相关推荐