GB/T20092-2013

中文新闻信息置标语言

Chinesenewsmarkuplanguage

本文分享国家标准中文新闻信息置标语言的全文阅读和高清PDF的下载,中文新闻信息置标语言的编号:GB/T20092-2013。中文新闻信息置标语言共有604页,发布于2014-07-15
  • 中国标准分类号(CCS)L67
  • 国际标准分类号(ICS)35.240.30
  • 实施日期2014-07-15
  • 文件格式PDF
  • 文本页数604页
  • 文件大小8.49M

中文新闻信息置标语言


国家标准 GB/T20092一2013 代替GB/T200922006 中文新闻信息置标语言 Chinesenewsmarkuplanguage 2013-12-31发布 2014-07-15实施 国家质量监督检监检疫总局 发布 国家标准花管理委员会国家标准
GB/T20092一2013 目 次 前言 范围 规范性引用文件 术语和定义 缩略语 规则和约定 5.1拼写规则 5.2元素表达及描述要求 5.3XML组件的命名 5.4CNMLXMLSchema的版本和变更约定 CNML体系结构 6.1原则 6.2总体结构 6.3文档层结构 稿件层结构 6.5内容项层结构 6.6元数据结构 6.7受控词表结构 6.8关系结构 CNML公共结构和基本数据类型 1C 7.1目标命名空间声明 16 7.2基本简单类型 7.3公共结构类型 7.4复杂元数据项类型 3: 7.5元数据相关的Sehema定 82 CNML的关系机制 91 8.1关系概述 91 关系定义 91 8.2 受控词描述机制 98 9.l 概述和分析 98 9.2受控词表的建模 99 受控词引用的建模 9.3 114 受控词表的例子 116 10数字签名 119 10.l 概述
GB/T20092一2013 119 10.2元数据描述 122 10.3数字签名样例 127 11CNML文档层结构 127 11.1概述 -- 1.2cNL元素((cNML) 128 1u.3词表编目结构 131 1.4信封结构 133 172 1.了稍件容器 I. 稿件关系容器 191 CNML稿件层 12 194 稿件层定义 12.l 194 标准元数据组 12.2 202 13CML内容项层 344 13.1CNML内容项层结构 344 13.2内容项层实体内容 349 内容项层的元数据 13.3 363 14CNML.内联智能标记 462 概述 14.1 462 14.2内联智能标记的命名空间 462 规范说明 14.3 462 14.4内联智能标记类型(cim;lntelligentMarkupType) 462 附录A(资料性附录CNML应用实例 474 附录B(资料性附录)CNM标准元素中英文对照表 497 附录c资料性附录CNMI类继承总图 503 附录D(资料性附录)受控词表 504 D.1受控词表的完善和更新 504 D.2CNMLXMSchema标准受控词表 504 附录E(规范性附录CNMLXMLSchema 518 597 附录F规范性附录内联智能标记XMLSchema 600 参考文献
GB/T20092一2013 前 言 本标准按照GB/T1.1一2009给出的规则起草 本标准代替GB/T200922006(《中文新闻信息置标语言》 本标准与GB/T20092一2006相比的主要变化如下 -删除了引言; 修改了第1章范围里的部分内容 修改了第2章规范性引用文件的引导语,删除了本标准中未直接引用的文件; 修改了第3章的部分术语定义 修改了第6章CNML体系结构中的图1,图2、图4、图7,以及附录C中的CNML类继承 总图 修改了6.4,删除了原稿件结构中与操作有关的内容,并删除了12.1.2; 删除了7.3,简化了关系的表达机制,并修改了第8章; 修改了第9章,删除了受控词的关系机制,修改了受控词的基类型,增加了对受控词表简化使 用的机制和受控词语义描述的功能 1.3,词表编目结构; l1.4,修改了标准的信封结构的部分定义以及有关应用示例 修改 1.5.2.3,修改了引用稿件类型定义; 修改 了稿件专题信息的相关类型, 8,增加了权利元数据组中授权使用信息下的元数据 修改 8,增加了对内容项分组引用和描述的结构 增加 修改 4、13.3.4.5,增加了音频、视频元数据组中的元数据项 4.6,新增了音视频合一的元数据组; 增加 删除了附录A.2,修改附录A.1内容并作为新的附录A 修改了附录B,增加了部分元素; 在附录D中增加了关系词表等受控词表 修改原有的附录F,改为定义内联智能标记的XMScherma; 针对以上修改和标准应用中提出的其他合理修改建议,对标准Schema作了相应修改,并根据 由此带来的变化,对相应的图表和内容进行了修改 本标准由全国中文新闻信息标准化技术委员会(SAC/TC352)提出并归口 本标准起草单位;新华通讯社、清华大学、北大方正电子有限公司、中科大洋科技发展股份有限 公司 本标准主要起草人;武国卫、刁毅刚,黄菁,李涓子,张鹏、曹学军、王付生 本标准所代替标准的历次版本发布情况为 GB/T20092一2006
GB/T20092一2013 中文新闻信息置标语言 范围 本标准规定了新闻行业中文新闻信息的体系结构、公共结构和基本数据类型,关系机制以及受控词 描述机制,并给出了新闻信息的数字签名和内联智能标记的使用方法 本标准适用于新闻信息电子数据的“采集、编辑、生成、发布、交换、存储、检索、评估反馈”等新闻信 息生命周期的各个环节 本标准的使用对象包括报刊、广播、电视,通讯社、新闻网站等新闻内容提供商及媒体应用与研究 机构 规范性引用文件 下列文件对于本文件的应用是必不可少的 凡是注日期的引用文件,仅注日期的版本适用于本文 件 凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件 GB/T4880.2一2000语种名称代码第2部分:3字母代码 GB/T4881一1985语种代码 s" GB/T7408一2005数据元和交换格式信息交换 日期和时间表示法(IS(O860l;2000,lIDT GB/T18793一2002信息技术可扩展置标语言(XML)1.0 GB/T20093一2006中文新闻信息分类与代码 术语和定义 GB/T7408一2005和GB/T18793一2002中界定的以及下列术语和定义适用于本文件 3.1 元元数据metametadata 定义和描述元数据的数据 3.2 受控词表controlledvocabulary 从专业的角度将同一范的主题进行归类后形成的词表,并允许以受控的方式进行词条修改和 扩展 3.3 cNM文档CNL d0cuent 符合本标准的XML实例文档 稿件item 文档中包含的可管理业务对象,它一般有完整的元数据和内容,表示一个完整的新闻信息或其他定 义信息
GB/T20092一2013 3.5 contentitem 内容项 实体稿件类型包含的单一内容,可以包含任意一种文字,图片、图形,音频,视频,视音频、多媒体,应 用文档等不同类型的数据内容及其元数据 3.6 信封envelop 完成新闻信息交换功能的组件结构 产品produet 新闻提供商按照特定的目的分类组织新闻的一种形式,以便提供给新闻消费者订购,一般与订购它 的 -组特定的新闻用户对应 “产品”是针对新闻合约和新闻分类而产生的一个概念 o 8 专稿speeialprduct 个别用户根据自己需要就特定内容稿件向供稿方进行预约,要求专门提供的供稿形式 栏目columm 对产品内容的一种细分方式 栏目可以是稿件的一种内容属性也可以是展示属性 缩略语 下列缩略语适用于本文件 CNML 中文新闻信息置标语言(ChineseNewsMarkupL.anguage) NewsML 新闻置标语言(NewsMarkupL.anguage 统一建模语言UnifiedModelingl.anguage) Idenifier 统一资源标识符(UniformResource 统一资源定位器UniformResourceLocator) 统一资源名称UniformResourceName) UTF-8 8位统一码转换格式(8-bitUnicodeTransformationFormat) XYML 可扩展置标语言ExtensibleMark Kuplanguage 规则和约定 5.1拼写规则 每个单词的首字母大写,其余字母均小写,不使用任何连字符,在名称中不使用下划线"-",句点""” 和连字符“一” 单词应完整使用,在名称中不使用缩略语,以保证语义的清晰,提高可读性 5.2元素表达及描述要求 在本标准Scherma的不同位置出现的元素如有不同的语义一般要求采用不同的元素名 标准文 档中出现元素名称时要求用)括起来作为提示,便于同其他类型的名词出现相区别,如,信封元素在本 文档中出现时应表示为(Envelop),而不是Envelop 本标准中元素标记的声明通常不以该元素的相关 父元素或祖先元素的路径表达式作为前缀 当相同语义的元素名在Sehema中出现不止一次时,需要 使用语境描述才能区别时,则应采用XPath的标准写法,以便于了解其出现的具体位置,如信封结构中 的当日发稿序号,可根据其不同语境表达为SentTo/SingleRecipient/Recipientlnfo/DailySequence或
GB/T20092一2013 SentTo/GroupRecipient/DailySequence XMIL组件的命名 本标准中与元素、属性、简单类型和复杂类型概念相关的命名基于如下约定 第一个单词的首字母是否大写是根据描 如果名称基于多个单词,每个单词的首字母应是大写的 述的概念的类型决定的 具体规定如下 a)元素的命名;第一个单词的首字母应是大写(如表示电子地址的元索ElectronicAddress)1 属性的命名;第一个单词的首字母应是小写(如Column元素的属性howPresent); b e)复杂类型的命名;第一个单词的首字母应是大写,类型名后添加后缀Type(如表示受控词引用 的复杂类型TopieUseType); d)简单类型的命名;第一个单词的首字母应是小写,类型名后添加后缀Type(如表示受控词引用 的简单类型topicRefType). 5.4CNMLXMLSchema 的版本和变更约定 CNMLXMLSche hema的版本号及变更遵循如下原则约定: a CNML.XMIlSchema采用“m.n”的格式表示XMISchema的版本信息,其中mn均为非负 整数,m表示大版本号取值,n表示小版本号取值; ",对应的目标名字空间URI为,btp://www b CNMLXMLSchema的初始版本号为“1.0” news-standards.org/2012/CNMLSchema,本次修订以后的版本号“2.0”,对应的目标名字空 间UR1为:http:/ /www.news-standards.org/2012/CNMSchema; 如果先前版本的任何实例文档针对新修订的CNMIXMLScherma继续保持合法,则新版本的 XMI.Schema只需要递增小版本号,并在xXMISchema的Version属性中指定新的版本号信 息,换言之,CNNMLXMLSchema的小版本变更严格遵循向前兼容原则: 如果先前版本的任何一篇实例文档在新修订的CNMIXMLSchema校验下不合法,则新版 本的XMLSchema需要递增大版本号m的取值,同时需要变更新版本CNMXMLSehema0 的目标名字空间为一个新的URI,换言之,CNMLXMLSehema的大版本变更并不遵循向前 兼容原则 CNMLXMLSchema新修订的版本颁布后,各个先前版本的文件仍将保留并对外公布 CNML体系结构 原则 本章定义中文新闻信息置标语言的总体结构,该结构用于新闻生产各个过程对新闻信息的描述 CNML结构的建立原则是 a)以新闻领域业务对内容的需求分析为基础 b) 独立于新闻样式的表现; e)独立于特定新闻内容; 独立于新闻信息标准的表示语言 d) 本标准对新闻内容本身,新闻内容管理和不同新闻内容之间关系以及对反映新闻内容的各类元数 据进行建模,并定义这些内容的描述方法 6.2总体结构 CNML总体结构如图1所示
GB/T20092一2013 XMI文档 词表编目 信封 稿件 稿件元数据 可颗带 描述型元数揪组 管理型元数据组 权利型元数据组 内容项 内容项元数据 可系 描述型元数据组 物理元数据组 权利型元数据组 双密 内容项关系集合 内容项系 内容项关系( 内容项 内容项 内容项 内容项 篇什关系菜 件关系( 确件关系( 稿件 稿件 稿件 稿件 图1CNML总体结构图 该模型规定了CNM对文档的描述方式,CNMl文档是一个包含文档层、稿件层和内容项层的三 层结构描述模型 一个CNNML.文档可以包含多个稿件,一个稿件可以由多个内容项组成 属于同一文 档的不同稿件组成一个稿件序列,稿件之间的关系描述与稿件的内容描述分离 属于同一内容项层的 内容组成一个序列,内容项之间的关系描述与内容项的描述分离 CNML在文档层中定义了用于文档通讯控制过程中的信息模型一信封结构 在稿件层和内容项 层的描述中,定义了对稿件层和内容项层的元数据描述模型 同时,稿件还定义了关系描述和受控词表 的定义和引用机制 个cNMI文档的结构包含文档层结构、稿件层结构、内容项层结构,元数据的结构,受控词表定 义和引用结构和关系结构 6.3文档层结构 文档层结构由四部分组成,即词表编目、信封、稿件集合和稿件关系集合,如图2所示 具体定义如下 词表编目:在CNML文档开始位置集中对使用的受控词表进行简化的别名描述; a
GB/T20092一2013 b信封:完成新闻信息交换功能的组件结构,描述了如下信息 1 传输标识;定义CNML.文档传输的一种标识符; 系统标识:定义生成发布CNML文档的系统名称 21 37 发送时间:定义为稿件的实际发送时间 定时发布时间:定义为稿件的计划发送时间 4 5)发送方:定义为发送稿件的人或机构 6 送达方;定义为一个或多个稿件接受者和机构; 7 发稿优先级:;定义为稿件的优先级; 8)服务信息;定义为新闻单位提供的新闻服务; 产品信息,定义为从新闻内容的角度出发,按照特定的分类方法具备相同内容特征的新闻 9 数据 躺件集合一个cNMl.文档可以包含一个或多个稍件, C d)稿件关系集合;一个CML文档的稿件关系集合包含对各个稿件之间的关系的描述 文档 词表编目 信封 稿件集 新郎稿件 新闻稿件 新闻稿件 稍件实例3) 偶作实例2) 稿件实例1 稿件关系集 派生关系 相关关系 稿件关系实例2) (稿件关系实例1D 稿件引用 稿件引用 稿件引用 稿件引用 图2文档层结构示意图 词表编目结构提供了简化CNML受控词表使用的可选机制 cNML中有些元素的取值来自受控 词表,每个内容提供商均可以自由地使用自己定义的或别的组织定义的受控词表 由于CNMI.中规范 的受控词表的语法描述较为冗长,为了简化cNML中受控词表的描述和方便程序的处理,CNML在文 档开始位置通过词表编目提供了对使用的受控词表进行简短的别名定义和外部引用的机制 6.4稿件层结构 稿件层结构由三部分组成,即稿件元数据集合、稿件内容集合、稿件内容关系集合,如图3所示 具体定义如下 稿件元数据集合包含一个稿件管理型元数据组,一个可选的描述型元数据组、一个可选的权利 a 型元数据组;还可以包含多个可扩展的其他元数据组实例 b)稿件内容集合;包含一个或多个具体内容项,不同类型的稿件拥有不同类型的内容 ? 稿件内容关系集合;包含一到多个组成稿件的多个内容项之间的关系
GB/T20092一2013 稿件 元数据集合 管理型元数据组 播述型元数据组 权利型元数据组 可扩展元数据组( 内容集合 内容项 内容项 内容项 稿件内容关系集合 内容项关系组 关系 关系 关系 图3稿件层结构示意图 稿件是文档中包含的可管理业务对象 本标准将稿件定义为描述型稿件和管理型稿件,描述型稿 件定义具有实际内容项的稿件,管理型稿件用于描述对应稿件的管理信息 描述型稿件分为实体类型稿件和抽象类型稿件 实体类型稿件可以是新闻稿件、广告稿件等,每个 实体型稿件中含有一个或多个具体的物理内容项 抽象类型稿件可以是引用稿件,引用稿件中内容项 只定义对内容项的引用的序列 管理型稿件可以是数字签名类型稿件、统计类型稿件,受控词表类型稿件等 为了方便对各类型稿件的管理和描述,本标准定义了如图4所示的多层次的稿件分类 篇 件 描述型稿件 管理型稿件 实体类型稿件 抽象类型稿件 数字签名型稿件 统计型稿件 受控词表型稿件 新闻稿件 广告稿件 引用稿件 图4稿件分类图
GB/T20092一2013 6.5 内容项层结构 内容项是实体稿件类型包含的具体内容,一个实体类型稿件既可以由多种不同类型的内容项组成. 也可以包含同一类型的不同内容项 本标准定义了以下类型的内容项 a)文本类型内容项:内容项中的内容只包含文字 图片类型内容项,内容项中的内容是图片类型的数据" b 图形类型内容项;内容项中的内容是图形类型的数据; 音频类型内容项:内容项中只包含音频数据; 视频类型内容项;内容项中只包含视频数据 内容项同时包含视频和音数据 视音频类型内容项 多媒体类型内容项;内容项中是多媒体类型的数据 g h)应用文档类型内容项:内容项是嵌人的一个应用文档 内容项层结构由两部分组成,即内容项元数据集合和数据内容,如图5所示 具体定义如下 内容项元数据集合包含一个可选的物理元数据组、一个可选的描述型元数据组、一个可选的权 利型元数据组,还可以包含多个其他类型的内容项元数据组; 数据内容是内容项包含的数据,可以以外部引用的方式存在,也可以嵌人到CNMI文档中,如 果内容项数据是二进制数据,则嵌人时需要进行编码 内容项 元数据集合 物理元数州组 描述型元数掘组 权利型元数据组 可扩展元数据组(e) 数据内容 图5内容项结构示意图 6.6元数据结构 元数据结构如图6所示
GB/T20092一2013 元数据集合 元数据组 元数据组 元元数据集合 元元数据项 元数据引用 元元数 元数据 据项 项名 元数据组 元数据项 元数据项 图6元数据结构示意图 本标准对一个信息实体的元数据描述分为若干个元数据组,每个元数据组内包含一个到多个元数 据项 每个元数据项是对信息实体的一个属性的描述 本标准定义了四类新闻信息元数据,每一类定义为一个元数据组,用户也可以基于标准中元数据组 基础结构引人新的无数组 标准中的四类元数据分别描述如下 新闻信息描述类元数据(即描述型元数据组)从信息共享和数据交互的需要出发,元数据最基 a 本的功能是对信息资源的内容、属性进行详细,全面的描述,以完整反映信息资源对象的全貌, 帮助用户了解数据;该类元数据可出现在稿件层和内容项层; 新闻信息管理类元数据(即管理型元数据组);提供新闻信息资源的存储、使用、管理、传输等 方面的信息;该类元数据仅在稿件层出现; 新闻信息权利类元数据即权利型元数据组);提供新闻信息其拥有者、版权等信息内容;可出 现在稿件层和内容项层; 新闻信息物理属性类元数据(即物理元数据组);对新闻信息物理属性、实体文件信息进行全 面详细的描述;该类元数据仅在内容项层出现 本标准支持对元数据的元数据信息(即元元数据)的描述;除上述四类元数据外,用户可以对标准元 数据组进行扩展 本标准根据元数据项取值特性,将其分成以下类型: 简单元数据项:该类元数据项的取值可以通过字符串进行表示; a d)基本元数据项;该类元数据项的取值可以通过字符串进行表示,而取值的具体数据类型是 XMLSehema规范定义的基本数据类型;
GB/I20092一2013 自定义取值类型的简单元数据项:该类元数据项的取值为简单数据类型,取值最终可以表示为 个字符串 但数据类型不是标准XMLSchema规范定义的基本数据类型,可以由扩展者 定义; 通过受控词表限定其取值的元数据项:该类元数据项的取值通过字符串进行表示,但是字符 串的取值应为受控词表中定义的一个词表项 有关受控词表的定义见第9章; 复杂元数据项;该类元数据项的取值相对复杂,无法通过一个简单的字符串进行描述,而应通 过具备一定结构的数据模型进行描述 本标准规定除了第一类元数据项以外,其他类型的元数据项均适用于复杂类型的元数据模型 受控词表结构 受控词表是新闻信息交换过程中一类重要的实体,它在新闻信息交换过程中定义了新闻领域和新 闻部门对某个具体事物描述的统一认识,是对数据的可理解的语义描述的基础 受控词表结构如图7 所示 受控词表 受控词包含子受控词 受挖词 受控词 受控词(包含子受控词) 受控词 受控词 受控词 图7受控词表结构示意图 本标准提供了受控词表定义以及受控词引用的描述机制,见9.2和9.3 本标准提供了受控词表稿件类型来定义受控词表,支持具有层次结构的受控词表描述,此外还提供 机制可以进一步描述受控词的刻面语义信息,例如,与其他受控词之间的关系等 6.8关系结构 本标准定义了用于描述同一类型信息实体之间的相互作用的关系结构,如图8所示
GB/T20092一2013 关系集 关系组 关系 关系名 目标 冰 元素引用 元素引用 元素引用集 元素引用集 元素引用 元素引用 元素引用 元素引用 关系 关系 关系 图8关系结构示意图 本标准规定: 同一类型实体间的关系用关系组描述 a 每个关系组中可以包含一到多个关系; b 每个关系描述具有同一种关系名称的关系源和目标源的集合 c D 每个关系中具有一个或多个关系源和关系目标组成的对 关系描述中具有一到多个关系元数据的描述 e 本标准将关系定义为下面四部分内容 关系名称:关系的语义概念; a 关系源;关系的发源体; b 关系目标:关系的接受体 c d 关系的元数据;描述关系的元数据,每一项元数据都为简单元数据项类型 目前,本标准定义的实体关系包括稿件之间、内容项之间的关系 CNMl公共结构和基本数据类型 目标命名空间声明 本版标准规定如下URI作为CNMIL的目标命名空间 g/2012/CNMLSchemma http://www.newsstandards .org 7.2基本简单类型 针对基于包括时间、日期等常见数据类型的简单元数据项,本标准定义了五类基本数据类型 10
GB/I20092一2013 XPath字符串类型,基础日期时间类型、日期时间类型、基础时间段类型和时间段类型 7.2.1XPath字符串类型(xPathype) XPath字符串类型见表1 表1 类型 限定继承自xs;string 中文名称XPath字符串类型 /?((child)?(\\e*;)?(\\c*)(\C\d+\])?))八\.l(.\.)/)*((child)?(\i 刻面限定 模式 c”;)?(\ile》)(\[\d+\])?))\.)I((attribute;:l@)(\\c*;)?(八\\c*I" × 说明 符合XPath语法限定的字符串类型 xs;simpleTypename="xPathType"》 Xs:annotation n》xPath字符串类型GB/T20092一2013 表2(续 nnn;多位数字表达的秒的细分时间数;nnn的取值范围为0到NNN一1,可以带2位小数 F;秒的细分部分数和秒的细分部分总数之间的分隔符 NNN:多位数字表达的每秒进一步细分的时间段数;例如:N21F1000表示每秒细分成1000等份,当 说明 前为第21等份,即0.021s [ZI[+|-hh;mm]];相对于UTC时间的本地时间;“”"表示东区时间,“一”表示西区时间;Z表示 UTc时间 xs;simpleTypename="baseTimePointType") 《xs;annotation xs;documentation)基础日期时间类型时间类型,例如2005-03-12Tl2:00:00:l2F3008;00 典型格式说明如下 -][YYYY[-MM[-DD]][Thh[:;mm[;s[;nmnFNNN]]]][zI[十|-]hh;mm YYYY年份,多位数字表示的时间年份,公元前年份带“-"作为前缀; MM月份,两位数字表示的月份 DD:日期,两位数字表示的日期; T;日期和时间的分隔符 hh:两位数字表示的小时数; mm:两位数字表示的分钟数 ss;两位数字表示的秒钟数 源码 nnn:多位数字表达的秒的细分时间数;nnn的取值范围为0到NNN一1,可以带2位小数; F;秒的细分部分数和秒的细分部分总数之间的分隔符 NNN:多位数字表达的每秒钟进一步细分的时间段数;例如:N21F1000表示每秒细分成1000等份 当前为第21等份 ,即0.02ls [ZI[十|-hh;mm]]:相对于UTC时间的本地时间;“十”"表示东区时间,“一"表示西区时间;Z表示 UTc时间 xs:documentation xs:restrictionbase "xs;string" xs:pattern value= -"-?(\d+八-\d(2)(\d2))?)?)?(T\d2)(\d2)(\d(2)(\d+(八\.\d(2))?)?)?)?)?(FN d+)?Z((\-I十\d2):\d2)?" 《/xs;restriction /xs;simpleType 12
GB/T20092一2013 7.2.3日期时间类型(timePointIype 日期时间类型见表3 表3 类型 限定继承自 baseTimePointTyPe 中文名称日期时间类型 -?\d+(\-\d2(-\d2)?)?)?T\d2:\d2:\d2(:\d)?)?)?)?F\d十)?Z 刻面限定 模式 (-I+\d2)\d(2))? 基本日期时间类型,限定继承自baseeTinmePontType,要求用自然数表达秒的细分部分数; 说明 例如2005,2003-02-22,2008-08-21T12:00;00等 xs;simpleTypename="timePointType") Xs:annotation documentation>》日期时间类型,例如2005,2003-02-22,2008-08-21T12:00;00等 mentation oeumentaiom)限定继承自BaeTimePoinType,要求用自然数表达秒的细分部分数 《/e 源码 nnotation rictionbase="baseTimePoint' Tpe” ICSl value= XS:pattern 八-"\d+(-\d(2)(\-\d(2]))?)?)?(T\d(2)(\dl2)(\dl2;(\d+)?)?)?)?(F\d+)?(Z(-I八十 \d2}:\d2)?" 《/Xs:restriction /xs;simpleType》 7.2.4基础时间段类型(baseDurationIype) 基础时间段类型见表4 表4 类型 限定继承自xs;string 基础时间段类型 中文名称 -?P(\d+D)?T(\d+H)?\d+M)?(\d+S)?(\d+N)?\d(2f)?)?(\dF)?(\- 刻面限定 模式 十)\d(2)\dl212)? 基础时间段类型,秒的细分部分数可以为带2位小数的十进制数 可以带时区偏移部分的措述,但该部 分描述对时间段计算不构成任何影响,仅仅用于表达时间段结束时间点所基于的时区信息 例如PIY3MsDT30H20M30s12N20.12F1000十08;00 其中P是该时间段格式的标志符,IY代表 说明 年,3M代表3个月,9D代表9天,T是日期和时间的分隔符,30H是30个小时,20M代表20分,30S代 表30秒,12N以及20.12F1000提供了秒以下更精确的时间信息, ,十08,00为该时间段对应的结束时间 点的时区信息 13
GB/T20092一2013 表4(续 xs;simpleTypename="baseDurationType" 《xs:annotation xs;documentaion)基础时间段类型,秒的细分部分数可以为带2位小数的十进制数 可以带时区 偏移部分的描述,但该部分描述对时间段计算不构成任何影响,仅仅用于表达时间段结束时间点所基 于的时区信息 例如 P9DT30H20M30S12N20.12F1000十08;00(/xs:documentation 源码 xs;restrietionbase="xs;string xs:pattern walue="\-?P(\d+D)?T(\d+H)?(\d+M)?\d+S)?(\d+N)?(\d(2)f)?)?\d+F)?((- \十\d2):\d'21Z)?"八 《/xs;restriction /xs;simpleType 7.2.5时间段类型(durationIype) 时间段类型见表5 表5 类型 限定继承自baseDurationType 中文名称时间段类型 P(\d+)?T(\d+H)?\d十M)?(\d+s)?(\d+N)?)?\d+F)?-I|+\d -? 刻面限定 模式 2}:\d2)Z)? 说明 限定继承自BaseDurationType,要求秒的细分部分数为自然数 例如PT2H30M50s21N xs;simpleTypename="durationType")》 《Xxs:annotation n)时间段类型,限定继承自aseDurationType,要求秒的细分部分数为自然数 documentation》 XS 例如PT2H30M50S21N(/xs;doeumentation /xs:annotation. 源码 xs;restrietionbase="baseDurationType"》 xs:pattern wdle="?P\d十D(T\d十B?(d十M(\d+s)?(d+9)?(d十F)((l\十\d2) \d2}Z)?") 《/xs;restriction /xs:simpleType 7.3公共结构类型 7.3.1公共属性组(commonGroup 公共属性组见表6 14
GB/T20092一2013 表6 公共属性组 中文名称 名称 默认值 固定值 类型 可用性 id 属性 xs;ID eid xs;string 公共属性组包含两个属性 id属性,类型为xs;ID类型,表示文档级的唯一标识符,它在整个XML文档范围内是唯一的 说明 eid属性,类型为 类型,表示元素级的唯一标识符,它在当前元素的父节点的直接子元素范围 xs;string 内是唯一的 xs;attributeGroupname="eommonGroup"" xs:annotation documentation)公共属性组(/xs;documentation annotaton xs;attributename="id"type="xs;ID"y XSamnOtat1On documentation)标识元素级唯一标识符,在所属父节点的子节点范围内保持唯一 《/xsdocu mentaion) Xs:annotation xsattribute》 GB/T20092一2013 表7(续 xs:annotation xs;documentation)类型《" /xs:documentation 源码 /Xs:annotation 《/xs;attribute /xs;attributeGroup 7.3.3计数模式属性组(segenceModeGroup 计数模式属性组见表8 表8 中文名称计数模式属性组 可用性 名称 类型 默认值 固定值 属性 mode Xs:string 计数模式属性组包含一个属性 mode属性用来区分不同的序列号计数模式,它有两种取值 说明 max;表示当前计数为最大号; min 表示当前计数为最小号 xs;attributeGroupname="sequenceModeGroup" xs:annotation documentation)计数模式属性组计数模式(/xs;documentation documenta XSailOTatlOin restrietionbase="xs;string" enumerationvalue="max xs;annotation 源码 sumenation)当前计数为最大号GB/T20092一2013 erenceGr0 7.3.4引用属性组(reler roup 引用属性组见表9 表g 中 文名称引用属性组 名称 类型 可用性 默认值 固定值 idref xs;IDREEF 可省 属性 xpath xPathType 可省 href xs;anyURI 可省 引用属性组包含3个属性,针对一个包含该引用属性组的元素实例而言,这3个属性只能任选其一来 书写 说明 dre属性;取值为xs;IDREF类型,使用某个元素的标识来指代引用元素; xpath属性;取值为xPathType类型,使用XPath表达式来指代引用元素; hre属性;取值为URI类型,使用URI来指代引用元素 xs;attributeGroupname="referenccGroup"》 annotation xs;documentation)引用属性组,针对一个包含该引用组的元素实例而言,3个引用属性只能任选 XS;documentation xsattriuute TTe "idref”type="xs:;lDREF”use="optional") :annotation >使用标识书写的元素引用 documentation /xs:documentation anmnotation 源码 XS+attIh1tP 'xpath”type-"xPathType”use="optional" name )采用XPath表达式书写的元素引用GB/T20092一2013 7.3.7引用类型RefereneeIype 引用类型见表12 表12 日attributes 日grpxeferenceGroup 结构图 ReferenceType 中文名称引用类型 名称 类型 可用性 默认值 固定值 idref xs;lDREF 可省 属性 xpath xPathType 可省 href xs;anyURIl 可省 表达元素引用的复杂类型,包含引用属性组,可使用该属性组中的任意一个属性来表示引用的元素 信息: dae属性;取值为e;IDREF类型,使用某个元素的标识来指代引用元素" 说明 xpath属性取值为xPathType类型,使用xPath表达式来指代引用元素; hre属性;取值为xs;anyURI类型,使用URI来指代引用元素 〈xs;complexTypename "ReferenceType”mixed="1"y xsannotation doeumentation)引用类型GB/T20092一2013 Telephone E1eetronicAadressTye 结构图 RL 中文名称 电子地址类型 TelephoneFaxEmailURL 子元素 表达电子地址信息的复杂类型,包含如下子元素 零到多个Teephone子元素;表示电话信息; 零到多个Fax子元素;表示传真信息 说明 零到多个Email子元素;表示电子邮箱信息 零到多个URL子元素:表示统一资源定位器 " "EleetronieAddres:Type xs:complexTypename= Xs:annotation >电子地址类型< xs:documentation /xs:documentation xs;annotation IT "Tlephone type="xs;string”nmin(Oecurs="o"naxOccurs="unbounded" name Annotation documentation>电话GB/T20092一2013 7.3.8.1电话元素((EleetronicAddressIype/ w/Ielephome) 电话元素见表14 表14 Telephone 结构图 tpexs:strin名 类型 xs:string 中文名称 电话 说明 表示电话信息,取值为字符串类型 xs;elementname="Telephone”type="xs;string”minOecurs="0"maxOecurs="unbounded"y 《xs:annotation 源码 xs;documentation)电话(/xs;documentation xs:annotation /xs:element 示例 ) 传真元素见表15 表15 Fax 结构图 taxtrins 类型 XS:strIng 传真 中文名称 说明 表示传真号码信息,取值为字符串类型 xs;elementname="Fax”type="xs:string”minOeeurs="0”maxOeurs="unbounded") xS:annotation 源码 aewmtsiatm)传真化" /xs;doeumentation :annotation /xs:element 示例 GB/T20092一2013 表16 置mai门 结构图 tesstrins xs;string 类型 电子邮箱 中文名称 说明 表示电子邮箱信息,取值为字符串类型 xs;elementname="Email”type="xs:string”minOecurs="o”maxOcurs="unbounded" xs;annotation 源码 xs;documentation>电子邮箱《/xs;doeumentation xs:annotation element》 X 示例 统一资源定位器元素见表17 表17 U 结构图 tnesanlUR工 类型 xs:anyURI 中文名称统一资源定位器 说明 1xs;anyURI类型 表示网址信息,取值为 xs;elementname="URL”type="xs;anyURI”min(Oeurs="o" maxOccurs-"unbounded") xs;annotation 源码 xs;doeumentation>网址〈/xs;doeumentation Xs:annotation /xs:element 示例 URL>http://www.cnml.org/2009/XMLSchemaGB/T20092一2013 表18 日atributes dateFrom" dateTo 曰prpkindGroup kind ,xml:1an着 PersonNameIyTel NameTitle 结构图 eCp79 u1lNane aNneCom3nene venName 0o FamivName 2迎9Heneo9en Nume了我tion tPe55tring 中文名称人名类型 NameTitleFulINameGivenNameFamilyNameNumerationm 子元素 名称 类型 可用性 默认值 固定值 dateFrom TimePointType 可省 属性 dateTo TimePointType 可省 kind xs;string 可省 xml,lang 表示人名信息的复杂类型,它包含如下属性: 属性,取值为日期时间类型,表示人名的启用时间 dateFromm dateTo属性,取值为日期时间类型,表示人名的停用时间; d属性,取值为字符串类型,表示人名的类别 kind xml.lang属性,取值为语种编码字符串.表示人名文字使用的语种 说明 除了上述属性以外,人名类型还包含五类子元素 子元素;表示人名的称谓或者头衔信息; NameTitle FullName子元素;表示人的全名信息; 子元素;表示人的名字信息; GivenName FamlyName子元素:表示人的姓氏信息; I,Henry等 Numeration子元素;表示可省的人名编号信息,西方人名中可能出现,例如Gorge 23
GB/T20092一2013 表18(续 xs:complexTy Typename="PersonNameType") 《xs;annotation 人名类型< documentation /xs;documentation X annotation XS-O1ieTe choieemaxOccurs="unbounded" '"NameTitle"type 'NameComponentType”minOceurs="0" name documentation》称谓/xs;documentation annotation eIItIll mennae "FullName”type="NameComponentType") aT1Om umentation)全名姓停用时间GB/T20092一2013 7.3.9.1称谓元素((PersonNameIype/NameTitle 称谓元素见表19 表19 NameComponentType attribule8 xm 1ang 结构图 NameTitle ACIy abbrev 类型 NamecComponentType 中文名称称谓 类型 名称 可用性 默认值 固定值 xml:;lang 属性 initial xs;string 可省 可省 abbrev xs;string 表示人名前的称谓信息,例如“先生",“阁下"等,为NameComponentType(人名部件类型). 它包含3个属性 说明 xml,lang属性表示称谓文字的语种信息; nitial属性表示称谓的首字母; abbrev属性表示称谓的缩写形式 称谓(/xs:documentation Xs;annotation 《/Xs:element 示例 GB/T20092一2013 表20 NameComponentIy Iype attribute8 结构图 Fml1Name COnenT 类型 NamcComponentTyP 中文名称 全名 名称 类型 可用性 默认值 固定值 xml;lang 属性 iinitial xs;string 可省 可省 abbrev xs;string 表示人名的全名信息,为NanmComponentType(人名部件类型) 它包含3个属性: xmllang属性表示全名文字的语种信息; 说明 initial属性表示全名的首字母; abbrev属性表示全名的缩写形式 "FullName"type="NameComponentType"》 Xs:element Xs:annotatIon xs;documentation)全名

GB/T20092-2013:中文新闻信息置标语言

作为一种国家标准,GB/T20092-2013在中文新闻信息标注中有着广泛的应用。通过使用这些标签,可以使新闻信息更加清晰、明确、易读,并能够方便地进行自动化处理。

<标题>

在新闻信息中,标题是最重要的部分之一。GB/T20092-2013中定义了<标题>标签,用于表示新闻信息的标题部分。例如:

<标题>我国成功发射首颗载人航天飞行器</标题>

<正文>

正文是新闻信息的主体部分,也是最具有价值的内容。GB/T20092-2013中定义了<正文>标签,用于表示新闻信息的正文部分。例如:

<正文>今天上午,我国在酒泉卫星发射中心成功发射了首颗载人航天飞行器。</正文>

<作者>

在新闻信息中,作者是新闻信息的署名人。GB/T20092-2013中定义了<作者>标签,用于表示新闻信息的作者部分。例如:

<作者>本报记者 张三</作者>

<时间>

时间是新闻信息的重要属性之一。GB/T20092-2013中定义了<时间>标签,用于表示新闻信息的时间部分。例如:

<时间>2023年6月7日 上午10:00</时间>

<来源>

来源是新闻信息的出处。GB/T20092-2013中定义了<来源>标签,用于表示新闻信息的来源部分。例如:

<来源>新华社</来源>

总之,GB/T20092-2013作为一种专门用于中文新闻信息标注的语言规范,可以有效地提高新闻信息的质量和可读性,为新闻信息的处理和应用提供了便利。

中文新闻信息置标语言的相关资料

    和中文新闻信息置标语言类似的标准

    信息技术先进音视频编码第2部分:视频
    上一篇 本文分享国家标准信息技术先进音视频编码第2部分:视频的全文阅读和高清PDF的下载,信息技术先进音视频编码第2部分:视频的编号:GB/T20090.2-2013。信息技术先进音视频编码第2部分:视频共有175页,发布于2014-07-15
    家庭网络第3部分:内部网关规范
    本文分享国家标准家庭网络第3部分:内部网关规范的全文阅读和高清PDF的下载,家庭网络第3部分:内部网关规范的编号:GB/T30246.3-2013。家庭网络第3部分:内部网关规范共有36页,发布于2014-07-15 下一篇
    相关推荐