GB/T35304-2017

统一内容标签格式规范

Uniformcontentlabelformatspecification

本文分享国家标准统一内容标签格式规范的全文阅读和高清PDF的下载,统一内容标签格式规范的编号:GB/T35304-2017。统一内容标签格式规范共有44页,发布于2018-04-01
  • 中国标准分类号(CCS)L72
  • 国际标准分类号(ICS)35.020
  • 实施日期2018-04-01
  • 文件格式PDF
  • 文本页数44页
  • 文件大小3.09M

统一内容标签格式规范


国家标准 GB/T35304一2017 统一内容标签格式规范 Uniformcontent abeltormatspeifeaton 2017-12-29发布 2018-04-01实施 中华人民共利国国家质量监督检验检疙总局 发布 国家标准化管理委员会国家标准
GB/35304一2017 目 次 前言 引言 范围 2 规范性引用文件 术语和定义 缩略语 统一内容标签格式描述约定 统一内容标签格式示意图 统一内容标签格式定义 7.1UCL代码部分(UCLCode) 21 7.2UCL属性部分(UCLProperties) 7.3补充说明 39 40 参考文献
GB/35304一2017 前 言 本标准按照GB/T1.1一2009给出的规则起草 本标准由全国中文新闻信息标准化技术委员会(SAC/TC352)提出并归口 本标准起草单位;东南大学,新华通讯社、国家新闻出版广电总局、清华大学,大有数字资源有限公 司、北京大学 本标准主要起草人;杨鹏、李幼平、吕锐、武国卫,周毅、刁毅刚、尹浩、吕勇强张长江、郑斌张利、 付蓉、孙宝传、张行功
GB/T35304一2017 引 言 大数据趋势与互联网飞速发展下的媒体变革,已经促使网络空间成为纷繁芜杂的内容大数据的集 散地 统一资源定位符URL(UniformResourceLd .ocator)是互联网中基础性,核心性和通用性的内容 标识标准,内容资源普遍采用URL进行标识 但是,以面向地址理念设计的URL,原理上无法描述内 容资源的丰富语义信息,也难以支持基于语义的内容组织和管理,由此带来内容资源难找难管、混乱失 序和不可信等问题 这些问题在内容大数据不断涌现的今天显得尤为突出 因此,应对内容大数据带 来的挑战,需要在网络空间中引人新的面向内容的标准基石 本标准针对URL的缺陷而提出,旨在全面支持网络空间中内容大数据的共享和治理 统一内容 标签UCL(UniformContentlabel)体现了内容驱动的全新设计理念,它贯穿内容的生产消费和管理 等关键环节,形成三位一体的网络空间内容大数据创新标识体系 统一内容标签可以从多个纬度描述 内容资源的特征,支持内容资源的认证、注册及追溯,结构灵活并允许按需裁剪和自由扩展 本标准主 一内容标签中各个域的名称、含义、用法及定义规则等格式信息进行描述和规约,为统一内容标 要对统一 签技术的推广,普及和应用提供关键的标准支持 IN
GB/35304一2017 统一内容标签格式规范 范围 本标准规定了统一内容标签(UCL)的格式,包括统一内容标签中各个域的名称、含义、用法及定义 规则等 本标准适用于对网络空间中面向群体受众的内容资源特征信息进行描述,可支持内容大数据的共 享和治理 本标准的使用对象包括通讯社、广播、电视、报刊、新闻网站等内容提供商及软件开发服 务商 注1:内容资源的特征信息包括代码信息、语义信息和管理信息等 注2内容大数据的共享和治理,包括内容资源的聚敛,传播、管理,知识翠取,可信认证和个性化主动服务等 规范性引用文件 下列文件对于本文件的应用是必不可少的 凡是注日期的引用文件,仅注日期的版本适用于本文 件 凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件 GB/T7408一2005数据元和交换格式信息交换日期和时间表示法 GB/T130002010信息技术通用多八位编码字符集(UCS) GB180302005信息技术中文编码字符集 GB/T200932013中文新闻信息分类与代码 术语和定义 下列术语和定义适用于本文件 3.1 内容元数据 cOntentmetadata 反映内容资源特征的描述性信息 3.2 统一内容标签uniformcontentlahel;UcI 包含代码信息,语义信息和管理信息等的内容元数据 3.3 统一资源标识符uniformresoureeidentifier;URI 包含名字或地址的短数据串,指向web上的某个对象 统一资源定位符uniformresoureeloeator;URL 包含地址的短数据串,指向web上的某个对象 URI是URI的子集 3.5 包 package 封装整个统一内容标签的数据包 一个UCL包由具有一定次序的多个域组成
GB/T35304一2017 3.6 域 field UCL包中含义相对独立和完整的连续数据单元 UCL包中的域分为两种:UCL代码域(UCI codefield)和UcL属性域(UcL.propertyfield 3.7 内容对象contentobjeet 被UCL包所描述的内容本身,也称被标内容对象(labelledcontentobject). 3.8 话题topic 反映内容主旨和要义的内容主题或议题 3.9 安全能级seeurityenerlevel 反映内容在来源、传输路径、品质、可信度和影响性等方面的安全程度等级 注:安全能级在UCI包认证和注册时可能调整,即发生安全能级跃迁 3.10 时间戳timestamp -地标识某一刻的时间的字符序列 唯 3.11 域的格式fiedformat 关于一个域的所有定义和描述信息的集合 3.12 净荷payloadl UCL属性域中的有效载荷数据 3.13 注解 note 关于域的涵义、使用、实现等的具体说明和解释信息 3.14 数据类型data type 域在填充时所使用的数据类型,如整数,受控词表,受控映射表、自由文本、结构体等 3.15 受控词表eontrollelveabulary 从专业的角度将属于同一范胯的主题词进行归类后所形成的词表,并允许以受控的方式进行词条 修改和扩展 3.16 受控映射表controledmappinglist 将属于同一范略的信息进行归类并为各条信息分配一个序号而形成的映射表,并允许以受控的方 式对映射表进行修改和更新 缩略语 下列缩略语适用于本文件
GB/35304一2017 BDT 北斗卫星导航系统时间(BeiDouTime) CDPs内容描述属性集合(ContentDesceriptionPropertiesSet) CGPs内容管理属性集合(ContentGovermancePropertiesSet) Check CRC 循环冗余校验(CyecicRe edundancy o1 数字对象标识符(DigitalObjectldentifier) s 数字签名算法(Digital SignatureAlgorithm Cce 椭圆曲线密码学(EIliptie CurvesCryptography) ECDsA椭圆曲线数字签名算法(EllipticCurveDigitalSignatureAlgorithm GPS 全球定位系统(GlobalPositioningSystem Hash-basedMe HMAC基于哈希函数的键控哈希算法 lessageAuthenticationCode) HTML超文本标记语言(HyperTextMarkupLanguagey ISBN 1ationalStandardBookNumber 国际标准书号(Internat sRC 国际标准音像制品编码 nternationalStandardRecordingCode) MD5 消息搁要算法第五版(MessageDigestAlgorithm-5) MIME多用途互联网邮件扩展类型(Mwltip ipurposeInternetMailExtensions POSIX可移植操作系统接口(PortableOperatingSystemlnterfaceofUNIX 基于数论的公钥密码体制(RivestShamir-AdlenmanCryptosystem RSA SHA 安全散列算法(SecureHashAlgorithm) UTc 协调世界时(CoordinatedUniversalTime) 5 统一内容标签格式描述约定 字节(Byte)是UCL包的基本组成单位,一个字节由8位(bit)二进制数组成 UCL包的起始字节 定义为第0字节,一个字节的起始位定义为第0位 UCL包或域的第n字节的第m位(0GB/T35304一2017 表1 名称 本标准在描述该域时所使用的名字 定义 简要描述域的含义和作用 域的位置 描述域在整个UcL包中的位置,范围和顺序等信息 域的长度 描述域的长度,以字节或位为单位 域的取值 描述域的取值范围、值的含义和约束条件等 格式所属版本 描述域的定义格式在哪些UCL版本中有效 注解 关于域的使用,实现等的具体说明和解释信息 数据类型 某个域在填充时所使用的数据类型 如果使用受控表(受控词表或受控映射表),填写相应的受控表名称;如果不使用这些受控表,则填 受控表说明 写“无" 描述该域在构成UCI包时是否必不可少,如果是,则填“必选”;如果否,则填“可选”;如果仅在标 是否必选 准UCL标引方式中必选,则填“标准UCL标引方式中必选” UCL属性部分每个UcL属性域的格式,按照表2的形式进行描述 表2 本标准在描述该域时所使用的名字 名称 定义 简要描述域的含义和作用 属性类别 描述属性域的属性类别、解析规则等信息 描述属性域的辅助信息、长度信息和速配信息等 属性长度 属性净荷 描述属性域的净荷数据部分的取值信息 格式所属版本 描述域的定义格式在哪些UuCL版本中有效 注解 关于域的使用、实现等的具体说明和解释信息 措述属性域的属性净荷部分在填充时所使用的数据类型 净荷数据类型 如果使用受控表(受控词表或受控映射表),填写相应的受控表名称;如果不使用这些受控表,则填 受控表说明 写“无” 描述该域在构成UCL包时是否必不可少,如果是,则填“必选”;如果否,则填“可选”;如果仅在标 是否必选 准UCI标引方式中必选,则填“标准UCI标引方式中必选” 6 统一内容标签格式示意图 统一内容标签(UCL)的格式如图1所示 UCL代码部分每个UCL代码域的具体定义见7.1. UCL属性部分每个UCI属性域的具体定义见7.2
GB/T35304一2017 媒体类型 优先级与策略 内容版权与类型 安全能级码 级 解析 二级 TM P&P 标志 SEe 内容来源 话题 cTc 类类 规处 第0~15B 第16~31B 版序号 复用字节段 语种 时间戳 代码校验 内容长度 共32B UcCL.code UCLProperties 代码信息 语义信息 管理信息 面向读者的内容导引 体现作者意图 支持内容依法管理 内容描述属性集合CDPs 内容 原创 文件 内容 内容 内容 UCL属性 内容内容 关联 内容版权 Drs 标愿关键词摘要作者实体 标记信息声信总息 对象 头部 总头部 UCL //OtherPropertiesSets 内容 传播 内容 内容 安全他 UcCL包 cGIs 内容数 路径 级信息 数字签名 出处 字签名 责任链 头部 ID 内容管理属性集合cGPs) 图1 统一内容标签UCL)格式示意图 统一内容标签格式定义 7.1UCL代码部分(UCICode 7.1.1概述 UCL代码部分的基本长度为32字节,它们称为基本UCL代码 除基本UCI代码之外,UCL代 码部分在需要时可以进行扩展,扩展部分的长度应是为16字节的整数倍,称为扩展UCL代码 本标准 主要描述基本UCL代码的格式,扩展UCL代码的格式一般由应用自行定义 UCL代码部分的域称为UCI代码域,每个UCL代码域都是二进制形式的整数 UCL代码域的具体格式描述如下,叙述中所使用的“该域”都仅指当前域 7.1.2版本(Version) 版本定义见表3
GB/T35304一2017 表3 名称 版本 该UCL包所属的版本号 定义 Ucl包的版本号一般记为UcL.m,其中“n”为整数,可取值1.2.3等 域的位置 位于UCL包的第0字节的第0位一第2位 域的长度 总共占3位 共有8种二进制取值,即0001l,其中 000保留,含义暂未定义 001对应版本号UCLvl; 域的取值 对应版本号UCL 0l0 v2 011对应版本号UCLv3; 100~111保留,含义暂未定义 格式所属版本 UcCLv1、UCLv2、UCLv3 注解 uCLv4及之后的版本,具体格式暂未定义 数据类型 二进制整数 无 受控表说明 是否必选 必选 7.1.3媒体类型(IypeofMedia 媒体类型定义见表4 表4 名称 媒体类型 定义 该UCL包所标识的内容所属的媒体类型 域的位置 位于UcL包的第0字节的第3位一第7位 域的长度 总共占5位 共有32种二进制取值,即0001l111,其中 00000001ll保留,含义暂未定义; 01o00表示新闻与信息门户; 01001表示搜索引擎" 01010表示内容与资讯服务; 表示商业应用 0l01 01100表示论坛与社区; 域的取值 o1101表示社交媒体与自媒体 01l10表示评论与舆情; 01111表示娱乐与游戏; 表示双结构网络应用" 0000 1000110100保留,含义暂未定义; 1o101表示网络图片与视听; 1o10表示数字报刊与图书
GB/35304一2017 表4(续 1ol1表示其他网络应用 11000表示电视(第三媒体); 11001表示广播(第二媒体); 域的取值 l1010表示报刊第一媒体); 11o11表示图书 11100表示音像制品 1110111111保留,含义暂未定义 格式所属版本 UCLvl 该域是对内容所属媒体类型的粗粒度描述,它需要与内容来源域(见7.1.7)等相配合 媒体类型的划分界限往往并不明晰,因此如果有多个可选媒体类型,则选择与内容特征最切近的 注解 媒体类型;在无法判定哪个媒体类型更切近时,选择取值最小的媒体类型 数据类型 二进制整数 无 受控表说明 是否必选 必选 7.1.4优先级与策略(Priority&Poliey 优先级与策略定义见表5 表5 名称 优先级与策略 定义 该UcL包所标识的内容的优先级别与分发策略 域的位置 位于UCL包的第1字节 域的长度 总共占8位 分成三个部分 第一部分共3位(第0位第2位); 第二部分共2位(第3位一第4位); 第二部分其3位(第5位一第7位) 第 部分,3位共有8种二进制取值,即000111,对应8种优先级(07) 数值越大,表示该 UCL包的优先级别越高 第 二部分,第3位,有2种二进制取值,其中: 0表示该UcL包采用高优先级非抢占式策略 域的取值 1表示该U(CI包采用高优先级抢占式策略 第4位,有2种二进制取值,其中 0表示即时分发; 表示定时分发 三部分,3位共有8种二进制取值,其中 000表示非循环分发; 表示在1h内循环分发; 001 010表示在2h内循环分发; 011表示在4h内循环分发;
GB/T35304一2017 表5(续 100表示在8h内循环分发 101表示在12h内循环分发; 域的取值 l10表示在24h内循环分发; 111表示在48h内循环分发 格式所属版本 UCL.vl 该域第一部分的优先级取值,不能高于安全能级码域(见7.1.12)中第二部分和第三部分的取值 未经内容提供商或权威内容中心认证的UCI包,优先级只具有参考意义 实现系统通常采用多级优先队列来分发UCL L包,具有高优先级的Ucl包将得到优先分发 如果 新到达分发系统的UcL包的优先级最高,并且该UcL包中该域的第3位取值为1,则分发系统将 中断所有正在分发的其他低优先级UCL包,优先分发该UCL包;但是,如果该UCL包中该域的 级tL包之后,再优先分发该 第3位取值为0,则分发系统将在处理完当前正在分发的低优先 UCI包, 注解 -般的UcC1包通常采用即时且非循环分发的方式,即该域的第4位一第7位取值为0000 当该域第三部分取值为001111时,均表示循环分发,其计时起点约定如下 若该域的第4位取值为0,计时起点为时间戳域(见7.1.15)记录的时刻 包所指定的定时时刻 若该域的第4位取值为1,计时起点为该UCL" 当该域的第4位取值为1即定时分发),或者该域第三部分取值为001lll即循环分发)时,如果 ,则复用字节段域(见7.1.17)包含有定时起点或循环方式相关 标志域(见7..5)的第2位取值为1 信息 具体参见复用字节段域的描述 数据类型 结构体,各 分 二进制整数 量为 无 受控表说明 是否必选 必选 7.1.5标志(Flag 标志定义见表6 表6 名称 标志 定义 为正确解析UCL包及其所标识的内容而抛供的控制或状态信息 域的位置 位于UCL包的第2字节 域的长度 总共占8位 分成三个部分 第一部分共2位(第0位第1位); 第二部分共2位(第2位一第3位) 第三部分共4位(第4位第7位) 域的取值 第 -部分,第0位,有2种二进制取值,其中 0表示c代码部分的长度不进行扩展,共32字节; 1表示UC代码部分的长度进行扩展,扩展部分的长度为16字节的整数倍 第1位,有2种二进制取值,其中 0表示该UC包没有UCL属性部分,这种情况可能出现在特殊的应用中;
GB/35304一2017 表6(续 表示该Ucl包有UcL.属性部分,是一个常规的Uc包 第二部分,第2位,有2种二进制取值,其中: 0表示复用字节段域(见7.1.17)不包含定时或循环分发信息 1表示复用字节段域包含有定时或循环分发信息 第3位,有2种二进制取值,其中 0表示复用字节段域不包含由应用定义的信息; 表示复用字节段域包含有由应用定义的信息. 当第一部分中第1位取值为0时,第三部分中第4位一第7位的含义暂未定义 当第一部分中第1位取值为1时,第三部分中第4位第7位的含义如下 域的取值 第4位,有2种二进制取值,其中 0表示该UCL包与内容对象彼此分离,即内容对象不包含在该U(CL包中; 1表示内容又双 象已经被包 含在该UCL包中,该UcL包是一份独立完整内容 第5位,有2种二进制取值,其中 0表示该UCI包的UCL属性部分没有关联UC域见7.2.13); 表示该UcL包的UcL.属性部分有关联UCL域,即该UCL包关联着其他UCL包 第6位,有2种二进制取值,其中 0表示该UcL包遵循标准UcL标引方式,UcL属性部分没有用户自定义属性域 1表示该UC包的UCI.属性部分有用户自定义或扩展的属性域 第7位,保留,含义暂未定义 UCLv1 格式所属版本 内容对象通常应该与UCL 包彼此分离,但内容对象也可能直接被包含在UCL包中 当内容对象直接被包含在UCL包中时,UCL包是一份独立完整内容,有两种情况: 内容对象不独立于UcC1包,它主要由UcCL属性部分的内 内容标题域(见7.2.4).内容关键词域 见7.2.5)、内容摘要域(见7.2.6)等UCL属性域所描述,此时该UCI包的UCI属性部分没有内 在本标准中,称这种情况的内容对象为非独立内含对象,这种UCI包多出 现在应急广播、短媒体数据分发等应用中 注解 -份独立完整内容 在本标准中,称这种情况的内容对 UCL属性部分的内容对象域来描述 象为可独立内含对象.它专门由 -部分中第1位的取值为1,并且该域第二部分中第5位的取值为1时,表示该UCL包 .包所标引的内容对象的关联内容 所描述的内容对象,是已经被其他UCI 则新闻作为内容对象被UCIa所标引,且关于该新闻的评论内容如果被UCLb所标 例如 引,则可以在UCLb中设置关联UCL域,指示UCIa是它的关联UCL,以此表明UCLb所标引的 la所标引的新闻本身之间具有关联性 新闻评论与UCL 数据类型 各个位有特定含义的二进制整数 无 受控表说明 是否必选 必选 7.1.6解析规则(ParseRule 解析规则定义见表7
GB/T35304一2017 表7 解析规则 名称 定义 该UCI包所遵循的主要解析标准或映射规则信息 域的位置 位于UcL包的第3字节字节以及第4字节的第0位第3位 域的长度 总共占12位 分成两个部分 第一部分共6位(第05位) 第二部分共6位(第6~11位). 域的取值 第一部分,6位共有64种二进制取值,指示该UCL包所遵循的一级解析标准或映射规则的编号 063) 第二部分,6位共有64种二进制取值,在第一部分(一级解析标准或映射规则)所描述的范围内,进 步指示该UCL包所遵循的二级解码标准或映射规则的编号(063 UuCLvl 格式所属版本 解析规则域可以指示UCL包的相关域的解析标准或映射规则信息,这些域如UCL代码部分的内 注解 容来源域(见7.1.7)、一级类别域(见7.l 二级类别域(见7.1.9)等 .8)和 数据类型 结构体,各分量为取自受控映射表的二进制整数 受控表说明 标准或规则的受控映射表 是否必选 必选 7.1.7内容来源(SoureeofContent) 内容来源定义见表8 表8 名称 内容来源 该UCI包所标识的内容的来源信息 定义 域的位置 位于UCL包的第4字节的第4位一第7位,以及UCL包的第5字节一第7字节 域的长度 总共占28位 分成两个部分 第一部分共4位(第0位第3位). 第二部分共24位(第4位一第27位》. -部分,第0位一第2位,共有8种二进制取值,其中 第 000保留 表示内容来源对应为网址或域名形式 001 010表示内容来源对应为机构名形式 域的取值 表示内容来源对应为应用相关的形式 100~1l1保留,含义暂未定义; 第3位,保留,含义暂未定义 第 二部分,24位所能表示的十进制数范围为0~16,777,215(即21一l),其中: 0254保留,含义暂未定义 255表示“其他”; 其余每个数字对应一个具体的内容来源 10
GB/35304一2017 表8(续 UuCLv1 格式所属版本 该域与UCL属性部分的内容出处域(见7.2.l6)的区别在于,该域的描述粒度一般较粗 之所以在 注解 UCL代码部分设置该域,是因为实际应用中UCL代码部分可能从UCL包中分离出来,在独立于 UCI属性部分的情况下,进行单独处理和解析 数据类型 结构体,各分量为二进制整数,第二分量为取自受控映射表的二进制整数 受控表说明 网址域名受控映射表,机构名受控映射表等 是否必选 必选 7.1.8一级类别(Category -级类别定义见表9 表g -级类别 名称 该UC包所标识的内容所属的一级分类类别 定义 域的位置 位于UCL包的第8字节 域的长度 总共占8位 -级 8位所能表示的十进制数范围为0255,每一个具体取值,表示内容所属的分类体系中的- 域的取值 分类类别,该分类体系主要由媒体类型域(见7.1.3)和解析规则域(见7.1.6)所指示 格式所属版本 UCLvl -级类别应尽量采用已被标准化的各种分类体系,如GB/T20093一2013 注解 数据类型 取自受控映射表的二进制整数 受控表说明 -级分类映射表 是否必选 必选 7.1.9二级类别(Subeategory) 二级类别定义见表10. 表10 名称 二级类别 定义 该UcL包所标识的内容所属的二级分类类别 域的位置 位于UCL包的第9字节 域的长度 总共占8位 8位所能表示的十进制数范围为0255,每一个具体取值表示在一级分类类别的基础上,进一步细 化得到的内容所属分类体系中的一个二级分类类别 域的取值 该域的取值范围及具体取值,通常由媒体类型域(见7.1.3),解析规则域(见7.1.6),以及一级类别 域(见7.1.8)所指示 1
GB/T35304一2017 表10(续 格式所属版本 UCIvl 注解 对内容所属的一级分类类别的进一步子类细分 数据类型 取自受控映射表的二进制整数 受控表说明 二级分类映射表 是香必选 必选 7.1.10话题(Iopie 话题定义见表11 表11 名称 话题 定义 该UCL包所标识的内容所属的话题 域的位置 位于UCI包的第10字节第13字节 域的长度 总共占32位 分成两个部分 第一部分共4位(第0位一第3位)7 第二部分共28位(第4位第31位. -部分,第0位,有2种二进制取值,其中 0表示第二部分记录的是一个大众话题, 域的取值 1表示第二部分记录的是一个小众话题 第l3位,保留,含义暂未定义 第二部分,28位所能表示的十进制数范围为0~268,435,455(即2*-1),其中 0~254保留,含义暂未定义;255表示“其他”; 其余每个数字对应一个具体的话题 格式所属版本 UCIvl 话题是UcL代码部分直接反映内容要义和主题的关键语义信息域,也是引领内容聚敛、分发以及 与用户兴趣进行匹配的语义聚类抽象 注解 具体话题由该域第二部分描述,它的含义与该域第一部分第0位的取值有关,其中: 0表示第二部分的取值对应于大众话题映射表中的一个话题; 1表示第二部分的取值对应于小众话题映射表中的一个话题 数据类型 结构体,各分量为二进制整数,第二分量为取自受控映射表的二进制整数 受控表说明 话题映射表 是否必选 必选 7.1.11内容版权与类型(Copyright&IypeofContent) 内容版权与类型定义见表12 12
GB/35304一2017 表12 名称 内容版权与类型 定义 该UCL包所标识内容的版权,原创性,以及内容所属类型信息 域的位置 位于UCL包的第14字节 域的长度 总共占8位 分成两个部分: 第一部分共4位(第03位). 第二部分共其4位(第4一7位》. 第 -部分,第0位,有2种二进制取值,其中 0表示该UcL包所标识的内容对象没有版权信息; 表示该UCL包所标识的内容对象具有版权信息 二进制取值,其中: 表示该UCI包所标识的内容对象为转载内容; 1表示该UCL包所标识的内容对象为原创性内容 第2 ,有2种二进制取值,其中 0表示该UCL包所标识的内容对象为免费内容; 域的取值 1表示该Ucl包所标识的内容对象为收费内容 第3位,保留,含义暂未定义 第二部分,4位共有16种二进制取值,描述内容对象所属的类型,其中, 保留,含义暂未定义 0000 0001表示文本 0010表示图像: 0011表示音频; 0100表示视频 0101表示彩信; 0110表示应用程序 表示复合类型; 0111 1000~lll1保留,含义暂未定义 UCLv 格式所属版本 第 -部分中第1位取值为1时,则内容来源域见7.1.7)记录的是内容的原始出处;若取值为0,则 注解 内容来源域记录的是内容最后一级转载的出处 网页的HM文件属于文本类型,但是包含有 图片、音频、视频、Flash等的富媒体网页,应该归为复合类型 数据类型 结构体,各分量为二进制整数 无 受控表说明 是否必选 必选 LevelCode 7.1.12安全能级码(Security Ener3 安全能级码定义见表13 13
GB/T35304一2017 表13 名称 安全能级码 定义 该UCL包及其标识的内容对象的简要安全级别与认证信息 域的位置 位于UCL包的第15字节 域的长度 总共占8位 分成三个部分; 第一部分共2位(第0位一第1位); 第二部分共3位(第2位第4位); 第三部分共3位(第5位一第7位). -部分,2位共有4种二进制取值,描述安全能级码的认证等级,其中 第 00表示在UCL生成时自行标定 表示已经过内容提供商认证; 域的取值 10表示已经过权威内容中心认证 保留 含义暂未定义 第 -部分,3位所能表示的十进制数范围为07,描述该UC包所标识内容的物理安全程度的 7),称为物理安全能级 数值越大,表示该UCL包所标识的内容的来源、责任主体 传输路径等的真实性和安全性越高 第 部分,3位所能表示的十进制数范围为0~7,描述该UCL包所标识内容的逻辑安全程度的 -7),称为逻辑安全能级 数值越大,表示该UcL包所标识的内容的完整性,不可否认 8种能级(0 性以及品量、可信度和影响性等越高 格式所属版本 UCI.vl 安全能级是借鉴物理学中电子轨道能级特性而提出的UCI安全概念 借助安全能级,可以支持基于UCL的内容可信认证与安全共享等 在计算安全能级(尤其是物理安全能级)时,需要联合考虑多方面安全要素,比如: 人(责任主体的电子身份信息) 事(因事而关联的活动信息)1 注解 物(与事关联的硬件或设备信息); 时间(与事关联的物理绝对时间 空间(基于卫星定位系统的物理位置信息. UCL属性部分有安全能级信息域(见7.2.20),它可以对安全能级进行细粒度描述 在 在UCL包及其标识内容的多级认证注册过程中,安全能级码域可能发生改变,如发生安全能级跃 迁等 此时,UCL属性部分的安全能级信息域需要作对应训整 数据类型 结构体,各分量为二进制整数 受控表说明 是否必选 必选 7.1.13语种(L.anguage 语种定义见表14 14
GB/35304一2017 表14 名称 语种 该UC包及其标识的内容的语种信息 定义 域的位置 位于UC包的第16字节 域的长度 总共占8位 分成两个部分: 第一部分共6位(第0位一第5位) 第二部分共2位(第6位第7位) 第 -部分,6位共有6种二进制取值,描述内容对象采用的主要语种,其中 000000~00o11l保留,含义暂未定义; 001000表示汉语(中文; 001001表示蒙古语(蒙古文) 001010表示藏语藏文); 00101 表示维吾尔语(维吾尔文); 001100表示哈萨克语(哈萨克文): 001o1表示朝鲜语(朝鲜文) 001l10表示柯尔克孜语柯尔克孜文); 001111表示满语满文; 表示傣语(傣文) 0l0000 010001表示彝语彝文); 010010表示壮语(壮文) 010011~o11110保留,含义暂未定义; 0llll表示其他少数民族语言 域的取值 100000~100011保留,含义暂未定义; 100100表示英语(英文); 10o101表示法语(法文); 1001l0表示俄语俄文); 10o111表示阿拉伯语(阿拉伯文); 101000表示西班牙语(西班牙文) 101001表示葡萄牙语葡萄牙文). 表示德语(德文) 101010 10101ll表示日语日文). 表示印地语(印地文) 101100 10l101表示孟加拉语孟加拉文); 101110表示意大利语(意大利文 101lll~llll10保留,含义暂未定义 111111表示除上述定义外的其他语种 二部分,2位共有4种二进制取值,其中 第 00表示UCL属性部分的主要语种与该域第一部分相同 01表示UCL属性部分的主要语种与UcL属性描述元语言(见7.2.2)相同 10表示UCL属性部分的主要语种与第一部分以及UCL属性描述元语言均不同 11保留,含义暂未定义 格式所属版本 UCLl 15
GB/T35304一2017 表14(续 在UCL包中,有三处涉及与语言种类有关的语种信息,分别是 1内容对象所采用的主要语种(如一部电影采用法语),由该域的第一部分描述 2)UCL属性部分的主要语种,它是UCIL属性部分各域的属性净荷分量见7.2,1)所采用的主要 语种,它如果与内容对象所采用的主要语种相同,则由该域的第一部分描述;如果与UcL属性描 述元语言相同,则由UcL属性总头部域中的元语言类别子分量(见7.2.2)描述;如果与上述两个语 种均不相同,则需要在UcL属性部分 的内容描述属性集合中类别号为0的属性元素中进行描述 注解 见7.2.3 属性描述元语言,它是对UCL属性部分进行描述和解释所使用的一种语言,主要用来描 3UCI 述和解释UCL属性部分的用户扩展信息或自定义信息等,由U(CL 属性总头部域的元语言类别子 分量进行描述 如果该UCI包的UCI代码部分的标志域见7.1.5)的第4位取值为l,并且该UCI包的UC属 性部分没有内容对象域见7.2.14),则该域的第一部分描述的就是UCL属性部分的主要语言,此 时该域的第二部分取值为00 数据类型 结构体,各分量为二进制整数 无 受控表说明 是否必选 必选 7.1.14内容长度(SizeofComtent) 内容长度定义见表15 表15 名称 内容长度 定义 该UCcL包所标识内容的简要长度信息 域的位置 位于UCL包的第17字节的第0位一第4位 域的长度 总共占5位 分成两个部分: 第一部分共3位(第0位第2位); 第二部分共2位(第3位第4位) 第 -部分,3位共有8种二进制取值,描述以最大长度单位(字节B、千字节KB,兆字节MB或吉字 节GB,且保证整数部分大于0)计的内容对象长度取值范围,其中 000表示区间[1 4 表示区间[4 001 ,l6; 010表示区间[l6,64); 011表示区间[64,128) 域的取值 100表示区间[128,256 101表示区间[256,5121 110表示区间[512,7687 表示区间[768,1024) 二部分,2位共有4种二进制取值,描述内容对象的最大长度单位,其中 第 00表示长度单位是B(字节,Byte); 01表示长度单位是KB(千字节,2"B)1 10表示长度单位是MB兆字节,2”B); 11表示长度单位是GB(吉字节,2”B 16
GB/35304一2017 表15(续 格式所属版本 UCL.wl 该域描述的是内容对象的简要长度信息,便于直接根据UCL代码部分进行策略选择 例如,假定 内容对象的准确长度为11l.010,048Byte,则它的最大长度单位是兆字节MB以此为单位计算内 容对象的长度为10.5MB,所以该域的第0位第4位取值为00110. 内容对象的准确长度可以记录 文件信息域(见7.2.12) 在UCIL属性部分的 注解 规定:当该UCI包的标志域见7.1.5)的第1位取值为1且第4位取值为0时,该域记录内容对象 它与该tcL包彼此分离 包的标志域的第1位取值为l且第 的总长度近似值 当该UCI 4位取值为1时,若UcL属性部分有内容对象域(见7.2.14),则该域记录内容对象域的总长 度近似值;若UCI属性部分没有内容对象域,则该域记录UCL属性部分的总长度近似值 当该UCL包的标志域的第1位取值为0时,则该域的第0位一第4位取值应为00000 数据类型 结构体,各分量为二进制整数 受控表说明 无 是否必选 必选 7.1.15时间戳(Timestamp 时间戳定义见表16. 表16 名称 时间戳 定义 该UCI包在生成或被认证时的时间戳 域的位置 位于UCL包的第17字节的第5位一第7位,以及第18字节一第22字节 域的长度 总共占43位 分成两个部分 第一部分共33位(第0位一第32位). 第二部分共10位(第33位第42位). 域的取值 第一部分,记录该UcL包在生成或被认证的时刻,距协调世界时UC时间1970年1月1日0时 0分0秒所流逝的秒数 第二部分,记录在提取时间截时刻的1s内的毫秒级精度时间戳数值 格式所属版本 UCLvl 时间标准有多种,包括PosIX 时间标准、 、GPS 时间标准和北斗时间标准(BDr) POSIX时间标准;它是Unix系统、类Unix系统如Linux系统)等操作系统中普遍采用的时间标 准它的时间起 点为UTC时间 1970年1月1日0时0分0秒 本标准中,UCL包的时间戳域与POSIX时间标准具有相同的时间起点 GPS时间标准;时间起点为UTC时间1980年1月6日0时0分0秒 GPS时间标准的时间起点 注解 距UCI.时间戳域的时间起点共315,964,800秒 北斗时间标准;时间起点为UTC时间2006年1月1日0时0分0秒 北斗时间标准的时间起点 距UCL时间戳域的时间起点共l,l36,073,600秒 在32位系统中,POSIX时间标准的最高位为符号位,所以32位能表示的最大时间是UTC时间 2038年1月19日3时14分7秒 17
GB/T35304一2017 表16(续 本标准中,UcL包的时间戳域第一部分的最高位(第0位)不作为符号位,33位所能表示的最大时 间是UTC时间2242年3月16日12时56分31秒 规定;时间戳域始终记录该UcL包最后一级被认证的时间,规则如下 注解 在生成UC包时,时间戳域记录填写该UCL包时的时间 当对UcL进行认证注册时,时间戳域记录该UCL包被认证的时间 若对UCI包进行多级认证注册,在每一级认证注册时都应更新时间截域 数据类型 结构体,各分量为二进制整数 无 受控表说明 是否必选 必选 7.1.16顺序号(SerialNumber 顺序号定义见表17 表17 名称 顺序号 定义 对该UcCL包所分配的基于时间戳域(见7.1.15)的序列号 域的位置 从UCI包的第23字节开始,可能占1字节3字节 域的长度 总长度可能有三种情况:8位、16位,24位 分成三个部分 第一部分共2位(第0位一第1位). 第二部分共2位(第2位一第3位); 第三部分,可能为4位,.12位、,20位. 第 -部分,2位共有4种二进制取值,其中: 00保留,含义暂未定义,此时该域总长为1字节(第三部分为4位); 表示该域总长为1字节,第三部分为4位(第4位一第7位) 0表示该域总长为2字节,第三部分为12位(第4位一第15位); (第4位一第23位) 表示该域总长为3字节,第三部分为20位 域的取值 当第一部分取值为01时,第二部分和第三部分记录所分配的顺序号,范围063 当第 毫秒内所分配的顺序号 三部分记求时间极域指示的1 当第一部分取值为10时,第 进制取值,其中 0表示第三部分记录的是时间截域基础上的微秒级精度时间截数值; 表示第三部分记录的是一般顺序号,不与微秒级精度时间戳数值对应 当第一部分取值为11时,第二部分中第2位有2种二进制取值,其中: 0表示第三部分记录的是时间戳域基础上的纳秒级精度时间戳数值; 1表示第三部分记录的是一般顺序号,不与纳秒级精度时间截数值对应 当第一部分取值为10、l1时,第二部分中第3位保留,含义暂未定义 UucCLvl 格式所属版本 18
GB/35304一2017 表17(续 该域记录的是填写或更新该UCL包时间截域的时刻即该UCL包生成时刻或被认证时刻的 1ms内,所分配的顺序号 该域通常需要联合时间戳域一起解释才有实际意义 当该域第一部分取值为10时,该域第三部分可以理解为对毫秒级精度时间截的补充,此时该域第 注解 三部分的取值或者是一个微秒级精度的时间戳数值(取值范围为0999,第三部分中第4位第5 位恒取值00),或者是一个模4,096(即2)计数器的值 当该域第一部分取值为l1时,该域第三部分的取值,或者是一个纳秒级精度的时间戳数值(取值范 围为0~999,999),或者是一个模1,048,576(即2")计数器的值 结构体,各分量为二进制整数 数据类型 受控表说明 无 是否必选 必选 7.1.17复用字节段(NultiplexBytes 复用字节段定义见表18 表18 复用字节段 名称 定义 UCL代码部分的多用途字节段 域的位置 紧接在顺序号域(见7.1,.16)之后直到UCL包的第29字节,可能占4字节~6字节 域的长度 总长度可能有三种情况32位、40位、48位 该域的总长度与顺序号域的总长度有关,分为三种情况 如果顺序号域的总长度为8位,则该域的总长度为48位; 如果顺序号域的总长度为16位,则该域的总长度为40位; 如果顺序号域的总长度为24位,则该域的总长度为32位 与标志域(见7.1.5)的第2位一第3位的取值有关 标志域的第2位一第 该域的具体取值及含 3位共有 00,表示该域未被启用,此时该域所有位全取值0 o ,但没有定时或循环分发信息; 10. ,也记录有其他的与应用相关的信息 域的取值 ,该域记录有定时或循环分发信息,包括 点相对时间截域(见7.l.15)的后移秒数 定时起点信息 周期单位和周期值,其0位第7位的含义如下 1;小时" 第0 第 表示周 ,取值含义为;00;保留,01;秒,l0;分,ll: -第1位取值为00时,6位全取值0. 当标志域的第2位一第3位取值为10时,复用字节段域分成两个部分 第一部分,除去第二部分之外的所有位,全取值0; 第二部分,可能为8位、24位、32位,具体长度及含义如下 8位,只包含循环周期信息,位于UCL包第29字节 24位,只包含定时起点信息,位于UCL包第27字节29字节; 19
GB/T35304一2017 表18(续 32位,定时起点信息位于U(CI包第26字节第28字节,循环周期信息位于第29字节 第二部分的具体长度,取决于优先级与策略域(见7.1.41)第4位~第7位的如下取值 000101ll,表示第二部分的长度只有8位; 1000,表示第二部分的长度为24位; 域的取值 0o1~1l11,表示第二部分的长度为32位 当标志域的第2位第3位取值为11时,复用字节段域分成两个部分 第一部分,除去第二部分之外的所有位,记录与应用相关的信息; 第二部分,具体长度及含义,与标志域第2位第3位取值为10时相同 格式所属版本 UCLvl 如果不需要在UcL代码部分记录应用自定义信息以及定时或循环分发信息,则复用字节段域一 般不被启用,此时该域所有位全取值0 通常的Ucl包不需要定时分发或者循环分发,因此一般 注解 情况下,不需要在复用字节段域中记录定时或循环分发信息 如果复用字节段域的长度为32位(4字节),并且该域既包含定时起点信息(3字节),又包含循环周 期信息(1字节),此时标志域的第2位第3位取值须为10 数据类型 二进制整数 无 受控表说明 是否必选 必选 7.1.18代码校验CodeCheck) 代码校验定义见表19 表19 名称 代码校验 UCL代码部分的校验码 定义 域的位置 位于Ucl包的第30字节一第31字节 域的长度 总共占16位 域的取值 针对UCL包的第0字节第29字节的CRC校验码 格式所属版本c y 注解 UcL代码部分的代码校验采用循环冗余检验算法CRcIl6ccITT版本 数据类型 CRC16-CCITT校验码 受控表说明 无 是否必选 必选 7.1.19代码扩展部分(CdeEt tension 代码扩展部分定义见表20. 20
GB/35304一2017 表20 名称 代码扩展部分 定义 在32字节基本UCL代码之外的扩展UCL代码部分 当标志域(见7.1.5)的第0位取值1时,表示UCI包带有UCL.代码扩展部分,它的起始位置为 域的位置 UCL包的第32字节 域的长度 UCL代码扩展部分的长度为16字节的整数倍 当标志域的第0位取值1时,该UCL包的第32字节是代码扩展部分的起始字节,若该字节的第0 域的取值 第3位所对应的十进制数值为N,则表示代码扩展部分长度为16×N字节 代码扩展部分的其余二进制位的取值及含义由应用定义 格式所属版本CL1 代码扩展部分仍然属于UCL代码,它为UcL包引人灵活可扩展能力和应用自定义功能 注解 规定:;代码扩展部分最后的2个字节,应为代码扩展部分的CRC16-CCITT校验码 数据类型 应用自定义类型 受控表说明 无 可选 是否必选 7.2UC属性部分(UCIProperties) 7.2.1概述 UCL属性部分记录与内容相关的多个属性信息 每个具体属性称为一个UCL属性元素 每个 UCL属性元素由一个UCL属性元素域定义 性质或功能相近的若干UCL属性元素构成一个UCL 属 性集合 每个UCL属性集合由一个UCL属性集合头部域和紧接其后的多个连续存放的UCL属性元 索域组成 UCL属性部分的第一个域是UCI属性总头部域,紧接其后的是多个(最多16个)UCL属性集合 本标准已定义的两个UCL属性集合是:内容描述属性集合(CDPS)和内容管理属性集合(CGPS) 在 标准UCL标引方式中,它们是UCL.属性部分必选的UCL属性集合 UCL属性总头部域,UCL 属性集合头部域和UCL 属性元素域,统称UCL 属性域 每个UCL 属 性域的格式描述,按照《属性类别,属性长度,属性净荷)形式进行定义和组织(三个分量按序连续存放) tcL属性总头部域和UcL属性集合头部域是特殊的头部描述信息城;它们如果作为一个单独的ucL 属性域来看,则不包含属性净荷分量;但如果从UCL属性域之间的概念隶属关系来看,位于它们之后 且隶属于它们的所有UCL 属性域,都可视为它们的属性净荷数据 UCL属性部分的主要UCL属性域的具体格式描述如下,叙述中所使用的“该域”都仅指当前域,所 使用的“该分量”都仅指当前分量 本标准中,凡是指明其属性净荷类型为自由文本的,属性净荷都使用 GB18030-2005(参考GB/T13000-2010)作为默认字符集编码 7.2.2UCL属性总头部HeadforALLUCLProperties UCL 属性总头部定义见表21. 21
GB/T35304一2017 表21 名称 UCL属性总头部 整个UCL属性部分的辅助解析信息、长度信息和速配信息等 定义 该分量总共占1个字节,位于整个域的第0字节,包含两个子分量 第 -子分量共4位(第0位一第3位) ,为元语言类别子分量; ,为解析规则子分量 第二子分量共4位(第4位一第7位 第 子分量,元语言类别子分量,描述UCL属性描述元语言的主要语种,其中: 0000保留,0001表示中文,0010表示英文,0011表示法文,0100表示俄文, 属性类型 0101表示阿拉伯文,01l0表示西班牙文,01l1表示葡萄牙文,1000表示德文 1001表示日文,10101110暂未定义,111l表示其他语种 第二子分量,解析规则子分量,指示该UCL属性域所辖范围内的解析标准或映射规则信息 如无 辅助解析规则,则该分量取值为 10000;此外,该分量的取值1ll1保留,含义暂未定义 后文遵循类 似约定 该分量可能占4个7个字节(即可能是4字节,5字节,6字节或7字节),分成三个子分量 第 Uc属性域的第1字节,称为长度头部字节 -子分量位于该 第二子分量位于长度头部字节之后,可能占1个一4个字节,称为长度值子分量 第三子分量位于长度值子分量之后,占2个字节,称为速配信息子分量 第 子分量,长度头部字节,它的0位7位含义如下 第0位一第1位保留,含义暂未定义:; 第2位一第5位,其值加1表示UCI.属性部分所包含的不同UCL属性集合的个数; 第6位第7位,其值加1表示位于其后的长度值子分量所占的字节数 第 二子分量,长度值子分量, 记录整个UCL.属性部分的总长度(单位字节),包括UcL属性部分 属性长度 所包含的所有UCL.属性集合的长度,以及UCL属性总头部域中属性类型分量和属性长度分量所 占的字节数 第 三子分量,速配信息子分量,快速指示UCcl 属性部分具体包含哪些类别号的CL 属性集合 若它的第X位(0GB/35304一2017 表21(续 净荷数据类型多个UcL属性集合 受控表说明 标准或规则的受控映射表 是否必选 必选 7.2.3内容描述属性集合头部(CDPSHead 内容描述属性集合头部定义见表22. 表22 内容描述属性集合头部 名称 定义 内容描述属性集合的辅助解析信息,长度信息和速配信息等 该分量总共占1个字节,位于整个域的第0字节,包含两个子分量 第一子分量共4位(第0位第3位),为UCL属性集合类别子分量; 属性类型 第二子分量共4位(第4位一第7位) ,为解析规则子分量 第一子分量,UCL属性集合类别子分量,取值为0001即属性集合类别号为1) 第二子分量,解析规则子分量,指示该域所辖范围的解析标准或映射规则信息 该分量可能占4个~7个字节,分成三个子分量: 第一子分量(1字节),为长度头部字节 第二子分量(可能占1个4个字节),为长度值子分量; 第三子分量(2字节),为速配信息子分量 子分量,长度头部字节,它的0位一7位含义如下 笼 第0位第1位保留,含义暂未定义 属性长度 第2 2位~第;位,其值加1表示所包含的内容描述属性元素个数" 第6位第7位,其值加1表示其后的长度值子分量所占字节数 第二子分量,长度值子分量,记录内容描述属性集合的总长度(单位;字节),包括被内容描述属性 集合所包含的所有内容描述属性元素域的长度,以及内容描述属性集合域中属性类型分量和属性 长度分量所占的字节数 第三子分量,速配信息子分量,快速指示该UCL属性集合具体包含有哪些类别号的UcL属性元 素 相关含义及用法类似7.2.2 属性净荷 内容描述属性集合中的所有UCL属性元素域,都可视为该UCL属性域的净荷数据 UuCLvl 格式所属版本 在标准UCL.标引方式中,内容描述属性集合是UCL属性部分的必选UCL属性集合 内容措述属性集合最多可以包含16个不同的UcL属性元素(内容描述属性元素),它们对应的属 性元素类别号为0~15,由每个UcL.属性元素的属性类型分量中所分配的4位二进制数表示 如果UCL代码部分的语种域见7.1.13)无法满足对实际语种的描述需求,可以在内容描述属性集 注解 合中类别号为0的属性元素中进行补充描述 规定:;内容描述属性集合的标准UCI属性元素包括 内容标题《属性元素类别号为1); 内容关键词属性元素类别号为2); 内容摘要(属性元素类别号为3); 23
GB/T35304一2017 表22(续 内容作者属性元素类别号为4); 内容实体(属性元素类别号为5); 内容标记(属性元素类别号为6); 版权信息(属性元素类别号为7)3 注解 原创声明属性元素类别号为8); 文件信息(属性元素类别号为9) 关联U(CL(属性元素类别号为l4); 内容对象(属性元素类别号为15) 属性元素类别号为g13的Ucl属性元素未定义,可由用户和应用自由扩展 净荷数据类型 多个内容描述属性元素 受控表说明 标准或规则的受控映射表 是否必选 标准UCL标引方式中必选 7.2.4内容标题(Title) 内容标题定义见表23 表23 名称 内容标题 定义 该UCL包所标识的内容的标题 该分量总共占1个字节,位于整个域的第0字节,包含两个子分量 第一子分量共4位(第0位~第3位),为UcL属性元素类别子分量 属性类型 第二子分量共4位(第4位第7位),为解析规则子分量 第一子分量,UCL属性元素类别子分量,取值为0001即属性元素类别号为1 第二子分量,解析规则子分量,指示适用于该域的解析标准或映射规则信息 该分量可能占2个3个字节,分成两个子分量: 第一子分量(1字节),为长度头部字节 第二子分量(可能占1个2个字节),为长度值子分量 第 -子分量,长度头部字节,它的0位7位含义如下: 属性长度 第0位~第5位保留,含义暂未定义 第6位第7位,其值加1表示长度值子分量所占字节数,l0、l1为非法取值 第二子分量,长度值子分量,记录内容标题域的总长度(单位;字节),包括该域中属性类型分量,属 性长度分量及属性净荷分量的总长度 属性净荷 内容的标题信息 格式所属版本 UCLvl 该域长度头部字节的第6位第7位通常取值为00,表示长度值子分量只占1个字节 这时,内 注解 容标题域的总长度不超过255个字节 净荷数据类型 自由文本 受控表说明 标准或规则的受控映射表 标准UcL标引方式中必选 是否必选 24
GB/35304一2017 7.2.5内容关键词(Keywords) 内容关键词定义见表24 表24 内容关键词 名称 定义 该UCL.包所标识的内容的关键间 该分量总共占1个字节,位于整个域的第0字节包含两个子分量 第一子分量共4位(第0位一第3位),为UCL.属性元素类别子分量; 属性类型 第二子分量共4位(第4位第7位),为解析规则子分量 第一子分量,UCL属性元素类别子分量,取值为0010(即属性元素类别号为2) 第二子分量,解析规则子分量,指示适用于该域的解析标准或映射规则信息 该分量可能占2个3个字节,分成两个子分量 第一子分量(1字节),为长度头部字节 第二子分量(可能占1个2个字节),为长度值子分量 第一子分量,长度头部字节,它的0位一7位含义如下 属性长度 第0位一第2位保留,含义暂未定义 第3位第5位,其值加1表示内容关键词个数,一般不超过5个,l11表示超过7个; 第6位一第7位,其值加1表示长度值子分量所占字节数,10,l1为非法取值 第二子分量,长度值子分量,记录内容关键词域的总长度单位:字节),包括该域中属性类型分量、 属性长度分量及属性净荷分量的总长度 属性净荷 多个内容关键词以西文半角符号“;”进行分隔 UCLyl 格式所属版本 注解 该域长度头部字节的第6位一第7位通常取值为00,表示该域总长度不超过255个字节 净荷数据类型 自由文本 受控表说明 标准或规则的受控映射表 是否必选 可选 7.2.6内容摘要(Abstraet 内容摘要定义见表25 表25 名称 内容摘要 定义 该UCL.包所标识的内容的摘要 该分量总共占1个字节,位于整个域的第0字节,包含两个子分量: 第一子分量共4位(第0位~第3位),为UL属性元素类别子分量 属性类型 第二子分量共4位(第4位一第7位),为解析规则子分量 第一子分量,UCL属性元素类别子分量,取值为001l(即属性元素类别号为3). 第二子分量,解析规则子分量,指示适用于该域的解析标准或映射规则信息 25
GB/T35304一2017 表25(续 该分量可能占2~3个字节,分成两个子分量 第一子分量(1字节),为长度头部字节; 第二子分量(可能占1个~2个字节),为长度值子分量 第一子分量,长度头部字节,它的0位一7位含义如下 属性长度 第0位第5位保留,含义暂未定义; 第6位一第7位,其值加1表示长度值子分量所占字节数,10,11为非法取值 第二子分量,长度值子分量,记录内容摘要域的总长度(单位;字节),包括该域中属性类型分量、属 性长度分量及属性净荷分量的总长度 属性净荷 内容的摘要信息 格式所属版本 UCIvl 内容的摘要信息应该言简意贼,反映该UcL包所标识内容的要义 注解 内容摘要域的总长度不应过长,通常不超过600字节 净荷数据类型自由文本 受控表说明 标准或规则的受控映射表 是否必选 标准UCL标引方式中必选 7.2.7 内容作者(Author 内容作者定义见表26 表26 名称 内容作者 定义 该UCL包所标识的内容的作者信息 该分量总共占1个字节,位于整个域的第0字节,包含两个子分量 第一子分量共4位(第0位一第3位),为UCL属性元素类别子分量 属性类型 第二子分量共4位(第4位第7位),为解析规则子分量 第 -子分量,UcL属性元素类别子分量,取值为o100(即属性元素类别号为4打) 第二子分量,解析规则子分量,指示适用于该域的解析标准或映射规则信息 该分量可能共占2个一3个字节,分成两个子分量 第一子分量(1字节),为长度头部字节; 个2个字节),为长度值子分量 第 -子分量,长度头部字节,它的0位一7位含义如下 属性长度 第0位第2位,其值表示作者人数,111表示超过6个; 第3位 5位,其值表示作者单位个数,l1l表示超过6个; 第6位第7位,其值加1表示长度值子分量所占字节数,10,l1为非法取值 子分量,长度值子分量,记录内容作者域的总长度(单位;字节),包括该域中属性类型分量,属 第 性长度分量及属性净荷分量的总长度 当存在多个作者及作者单位时,以西文半角符号“;”“;”和“\r”进行分隔,具体形式如“作者xal; 和 属性净荷 作者xa2;作者xa3,单位xbl;单位xh2\作者yal;作者ya2单位yb1”,表示三位作者xal,.xa2 xa3都属于单位xbl和xb2,而作者yal和ya2属于单位ybl 26

统一内容标签格式规范GB/T35304-2017

统一内容标签格式规范GB/T35304-2017是我国在互联网时代背景下为了统一不同媒体发布平台上的信息内容而制定的一套标准。在这个标准中,定义了一系列可用于描述信息内容的标签元素,以及这些标签应该如何使用、排版和呈现。

这个标准的目的是让不同发布平台上的信息内容能够有一个统一的展示形式,保证用户能够更加方便、清晰地获取信息。标准中明确规定了每个标签的名称、语法格式、应用场景和使用方法等方面的内容。下面我们分别介绍一下这些规定:

标签名称

标签的命名应该简单明了、易于记忆,且具有一定的意义和表达能力。每个标签名称由两部分组成,第一部分是字母“c”,表示该标签是内容标签;第二部分是标签的具体名称,例如“c-body”表示文本主体内容。

语法格式

每个标签都由“<”、“/”和标签名称三部分组成,其中“<”表示开始标签,“/”表示结束标签。“<”和标签名称之间可以有一些属性,用于表达标签的附加信息。属性由属性名和属性值两部分组成,中间用等号“=”隔开。例如“<c-img src="xxx.jpg" alt="图片描述"/>”表示一张图片,src属性说明图片地址,alt属性说明图片描述。

应用场景

不同的标签可以在不同的应用场景中使用,例如“c-title”用于表示文章标题,“c-info”用于表示文章作者和发布时间,“c-source”用于表示文章来源等。这些标签的应用场景可以根据实际需要进行扩展和调整。

使用方法

使用标签时需要严格遵守GB/T35304-2017规范中的各项规定,并注意标签的嵌套、层级关系和排版效果。同时,还需要充分发挥标签的表现力,尽可能地用最简单、直接的方式表达出所需的信息内容。

总之,GB/T35304-2017统一内容标签格式规范是一套非常实用、可操作的标准,对于不同媒体发布平台上的信息内容统一化有着重要的作用。希望大家能够认真阅读这个标准,并在实际应用中加以灵活运用。

和统一内容标签格式规范类似的标准

公共服务领域日文译写规范
上一篇 本文分享国家标准公共服务领域日文译写规范的全文阅读和高清PDF的下载,公共服务领域日文译写规范的编号:GB/T35303-2017。公共服务领域日文译写规范共有30页,发布于2018-07-01
太阳能电池用砷化镓单晶抛光片
本文分享国家标准太阳能电池用砷化镓单晶抛光片的全文阅读和高清PDF的下载,太阳能电池用砷化镓单晶抛光片的编号:GB/T35305-2017。太阳能电池用砷化镓单晶抛光片共有10页,发布于2018-07-01 下一篇
相关推荐