GB/T34052.1-2017

统计数据与元数据交换(SDMX)第1部分:框架

Statisticaldataandmetadataexchange—Part1:Framework

本文分享国家标准统计数据与元数据交换(SDMX)第1部分:框架的全文阅读和高清PDF的下载,统计数据与元数据交换(SDMX)第1部分:框架的编号:GB/T34052.1-2017。统计数据与元数据交换(SDMX)第1部分:框架共有18页,发布于2018-02-01
  • 中国标准分类号(CCS)L70
  • 国际标准分类号(ICS)03.120.30
  • 实施日期2018-02-01
  • 文件格式PDF
  • 文本页数18页
  • 文件大小1.52M

统计数据与元数据交换(SDMX)第1部分:框架


国家标准 GB/34052.1一2017 统计数据与元数据交换(SDMX 第1部分;框架 Statistiealdataandmetadataexehange一Part1:Framework 2017-07-31发布 2018-02-01实施 中华人民共利国国家质量监督检验检疙总局 发布 国家标准化管理委员会国家标准
GB;/T34052.1一2017 前 言 《统计数据与元数据交换(SDMX)》目前包括7个部分,以后随着技术发展可能增加新的部分 第1部分:框架; 第2部分;信息模型统一建模语言(UML)概念设计; -第3部分:SDMX-ML模式和文档(XMLScher ema; 第4部分SDMX-ED1语法和文档(ED); -第5部分:注册规范逻辑功能和逻辑接口; 第6部分;技术说明 -第7部分:web服务使用指南 本部分为《统计数据与元数据交换(SDMX)》的第1部分 本部分按照GB/T1.1一209给出的规则起草 本部分由全国电子业务标准化技术委员会(sAc/TC83)提出并归口 本部分起草单位;标准化研究院、北京海奉方圆科技股份有限公司,杭州市标准化研究院 本部分起草人;章建方、,邢立强、李秀娜、蒋红宇、安晓江、程越、柳增寿、柳晶
GB/T34052.1一2017 引 言 统计数据与元数据交换(SDMX)是联合国统计署(UNsD)、国际结算银行(BIS)、国际货币基金 IMF)、经合发组织(OECD),世界银行(WB),欧洲中央银行(ECB),欧盟统计局(EUROSTAT)等国际 组织共同研制的标准 本部分参考《SDMIXStandards:Seetion1FrameworkforsSDMXTechnieal Standardsversion 12.1(《统计数据与元数据交换(SDMX第1部分:框架2.1版本)编制
GB;/T34052.1一2017 统计数据与元数据交换(SDMX 第1部分:框架 范围 统计数据与元数据交换(SDMX)》的本部分规定了统计数据和元数据交换的过程和业务范围、 SDMx信息模型建模方法,SDMIx的交换格式(SDMIX-ED1,SDMX-MI),SDMx符合性以及与sDMX 面向内容指南之间的依赖关系 本部分适用于统计数据与元数据的交换和共享 规范性引用文件 下列文件对于本文件的应用是必不可少的 凡是注日期的引用文件,仅注日期的版本适用于本文 件 凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件 GB/T18391.12009信息技术元数据注册系统(MDR)第1部分;框架 信息技术元数据注册系统(MDR)第3部分;注册系统元模型与基本 GB/T18391.32009 属性 GB/T18391.6一2009信息技术元数据注册系统(MDR)第6部分;注册 术语和定义 下列术语和定义适用于本文件 3.1 属性attribute -个对象或实体的特征 [GB/T18391.1一2009,定义3.1.1] 3.2 class 类 具有相同属性、操作、方法,关系和语义的对象集合的描述 [[GB/T18391.1一2009,定义3.1.2] 3.3 标识符identifier 在一个规定的语境中,能够用来唯一标识与其相关联的事物的字符序列 [GB/T18391.l2009,定义3.1.3 3,4 关系relationship 模型元素之间的联系 [[GB/T18391.1一2009,定义3.1.4]
GB/T34052.1一2017 3.5 元数据metadata 定义和描述其他数据的数据 [GB/T18391.1一2009,定义3.2.16] 注在sDMx中,元数据包含结构元数据和引用元数据 3.6 统计数据statistiealdata 通常是与时间相关联的观渊数值的集合,同时还与表示特定概念的一系列元数帮值相关联,它通常 是以数据结构定义(DSD)的形式来进行结构化的 3.7 数据立方体cubeofdata -种丰富且多维度的数据结构 注:在国际标准英文版中,cube一词,都加以引号来表示,GB/T34052只采用ceube的立方体概念,但其含义不限于 三维 3.8 维度dmensioality 无单位的一种度量表达 [GB/T18391.3一2009,定义3.3.68 3.9 引用元数据refereneemetadata 独立于统计数据的附加的解释性元数据,通常以文字的形式来描述统计数据的概念、获取方法以及 质量等有关方面的信息 3.10 结构元数据structuralmetadata 与数据相关联的,且对数据进行描述、标识和检索的元数据 示例:如统计数据立方体中维度和变量的名称 3.11 datastreturedefinition;DSD 数据结构定义 通过多个概念对数据集中所包含的所有结构元数据进行描述,包括概念是如何与“数据立方体”的 度量、维度和属性相关联的信息,同时也包括概念与数据和标识性、描述性(结构性)的元数据的表示法 都相关的信息 3.12 数据集dataset 以离散集合形式所组成的,并且共享着同一结构,同时涵盖某一确定时间周期的相似数据的集合 它包含了按照数据结构定义所规范的数据和相关元数据的集合 3.13 引用元数据集refereneemetadataset 引用元数据的集合,它可以描述数据或数据结构定义的维护者;也可以描述发布数据的时间表;也 可以描述单一类型的、随时间流动的数据;还可以描述数据的质量等 注;引用元数据的创建者可以使用他们所关心的任意概念,并给出包含这些概念相关信息的引用元数据集 3.14 约束 cOnstraint 定义数据的完整性以及数据层级等的相关规则
GB;/T34052.1一2017 注:可以限制在数据或元数据流层面或供应协议层面的数据交换,可以与数据结构定义、供应协议、数据流、元数据 流、数据提供方相互关联 3.15 供应协议provisionagreement 数据提供方提供数据集和元数据集方式的信息集 3.16 分类方案categoryscheme 根据对象具有的共同的特征将对象进行排列或分组的描述性信息 [GB/T18391.12009,定义3.3.4们 注在sDMXx中,分类方案可以包括对数据和元数据进行组织的任意类型 分类可将某一类型与某一可标识的对 象相关联 通过这种方式可以给对象集进行分类 统计专题域方案在sDMx中作为分类方案来实施 3.17 结构集 structureset 提供了结构元数据的组织机制,该机制对特定的数据集和元数据集之间的关系进行了完整的描述 注,结构集可用于对维度和属性与其他维度和属性进行相互映射,以及对概念进行映射,对代码表进行映射和对分 类方案进行映射 在同一“数据立方体”中,即使数据没有在同一维度,结构集也可用于描述“数据立方体” 3.18 报告分类法reportingtaxonomy 将许多数据立方体或数据流定义关联起来,形成完整的数据或元数据报告的分类方法 注:报告分类法支持通常由多个不同种类的数据立方体所构成的主要报告,但也可以支持其他的采集和报告功能 根据包含在出版物中的数据或元数据,报告分类法还可以支持诸如年鉴之类的出版物的规范 3.19 统计专题域statistiealsubjeet-matterdomains 在变量、概念和方法等方面具有共同特征的统计活动,旨在组织广泛的统计交换和分类工作 3.20 横截面数据eross-sectionaldata 在某一时点收集的不同对象的数据,它对应同一时点上不同空间(对象)所组成的一维数据集合 3.21 时间序列数据time-seriesdata 在不同时间点上收集到的数据,这类数据反映了某一事物、现象等随时间的变化状态或程度 3.22 数据流定义dataflowdefinition 用于标识数据结构定义,并且可以通过分类与一个或多个主题域相关联 数据集按照数据流定义 进行报告或传播 3.23 元数据流定义metadaaowdefmitom 用于标识元数据结构定义,并且可以通过分类与一个或多个主题域相关联 元数据集按照元数据 流定义进行报告或发布 注,元数据流定义与数据流定义非常类似,但是它用于对元数据集进行描述,分类和约束 3.24 注册registrautim 以使每个组织机构都可以获得的方式赋予管理项一个无歧义的标识符 [GB/T18391.62009定义3.18]
GB/T34052.1一2017 过程和业务范围 4.1过程模式 SDMX确立了统计数据和元数据交换的3类基本过程模式 这3类模式描述如下 双边交换 a 该交换过程的各个方面都已在双边之间进行商定包括数据和元数据的交换机制、交换格式、交换 频度或交换时间表以及交换时通信所使用的模式 此类模式也许是最为常用的过程模式 b)网关交换 该交换过程是一种有组织的双边交换集合 通过该类交换,若干个数据和元数据采集组织或个人 同意相互之间采用已知的单一格式,并且依照已知的单一过程来交换所采集的信息 该模式的作用在 于减轻了共享组织/个人之间(在数据和元数据采集领域)管理多个双边交换行为所带来的负担 该模 式也是统计领域非常常见的一种过程模式 在该模式中,各机构在其职责范围内确定了提高效率的交 换方式 数据共享交换 c 该交换过程是已知的、标准化的,并且是开放,可以自由使用的数据格式和过程模式 因此,任何组 织或个人都可以使用任何一方的数据和元数据(假如这些组织或个人已获得访问许可权) 该模式不要 求双方签署协议,而只要求数据和元数据提供方和使用方遵守GB/T34052 GB/T34052规定了基于以上任一过程模式进行交换的SDMX标准,并阐述了sSDMX在各种情况 下是如何体现其优势的 经双方同意,既可以使用某种标准格式(例如SDMX-ED1或SDMX-ML);采 用网关交换模式的数据发送方也可以采用某种标准格式与对方进行数据交换或与采用同一标准格式的 数据供应方之间进行数据交换;同时还可以商定使用sDMIx全部标准以支持常用的数据共享交换过程 模式,而不论其是否基于符合sDMX的注册中心还是其他体系架构 GB/T34052规定了支持基于使用了注册服务中心的数据共享过程的模式 注册服务为统计领域 中的数据和元数据提供了可视性,并通过提供一系列用于自动化处理的触发器以支持访问和使用这些 数据和元数据 而数据或元数据本身并不存储在注册中心,注册服务仅提供了一系列与位于已知位置 的数据(以及其他元数据)相关的实用元数据集,以便用户/应用程序可以轻松地找到和获得所注册的任 何数据和/或元数据 GB/T34052对于所有数据、元数据和注册服务本身的应用是普遍适用的,从而 使数据共享机构达到高水平自动化程度 应当指出的是,这些不同的过程模式并不是相互排斥的,只要符合SDMX格式的、可以表达数据和 元数据的单一系统就可以全部支持这3种场景 不同的标准可能适用于不同的过程(例如,许多注册服 务接口仅用于数据共享场景中),但是,所有标准都是以共享信息模型为共同的基础 除了考虑数据采集和报告以外,还需重点考虑到数据的传播 数据和元数据不论在其形成和创建 过程中是如何在各方之间进行交换的,它们最后都是提供给某种类型的终端用户 这通常是通过机构 内部的专用应用程序软件来实现 但是,数据和元数据也越来越频繁地以各种格式发布在网络上 数 据及其伴随的元数据在网络上的传播正是sDMIx标准的焦点 统计数据和元数据标准能够在数据发 布领域实现改进,一旦获得了数据,以某种标准格式处理数据就会变得更加容易 而且,数据和元数据 链接在一起,使得对数据的理解和进一步处理变得更加容易 讨论统计数据时,统计数据传播中的许多方面(诸如数据发现、易用性和适时性)都影响到数据质 量 sDMX标准为数据传播的这些方面提供了全面支持 标准数据格式促进了易用性并提供了与相 关元数据之间的链接 注册服务的概念意味着可以更容易地发现数据和元数据 适时性在数据整个生 命周期内通过效率的提高而得到了改进,并经由元数据的可用性和易用性而得到加强 需重点指出的是,SDMX主要集中于统计数据和元数据的交换和传播领域 但是,在与组织和用
GB;/T34052.1一2017 户之间进行交换无关的数据内部处理的环境之中,GB/T34052所规定的标准模型和格式也可能拥有 多种用途 为了数据交换和传播之目的而对数据和元数据进行标准格式化,这可能方便了组织和用户 所进行的内部处理工作,但这并不是GB/T34052的重点所在 4.2SDMIx和过程自动化 统计数据和元数据的交换采用了许多不同的自动化过程,其中某些自动化过程应用得非常广泛 此外,某些信息技术在今天的信息系统中几乎无处不在 SDMIX旨在为那些自动化过程和技术提供最 有用的标准 这些过程简要描述如下: -数据和元数据的批量交换:在各方之间传输整个或部分数据库,包括逐渐增多的更新数据和元 数据 在因特网上提供数据和元数据因特网技术(包括其在专用或半专用TcP/IP网络上的应用 是极为常见的 这些技术包括XM和web服务作为自动化进行数据和元数据供应的主要 机制,还包括了传统的静态HTML和数据库驱动类型的发布 公共过程尽管有许多应用程序和过程是专门用于某些数据和元数据集,但其他类型的自动化 服务和过程用来处理任何类型的统计数据和元数据 当可在因特网进行门户网站和数据输人 时,这一点特别适用 数据表示和转换为了让数据和元数据可为使用者所使用,应支持将数据和元数据自动转换为 特定应用程序能够进行处理的格式或其他标准格式或表义格式 尽管这种自动化过程类型严 格意义上并不属于交换,但在双方能够自动进行信息交换时,则这种自动化过程类型还应是被 支持的需求 sDMX标准可用于支持上述所有这些自动化过程和技术的需求 4.3统计数据和元数据 为避免对sDMX格式包含哪些“数据”和“元数据”产生混淆,特别提供了范围声明 统计数据通常 是与时间相关联的数字的集合,这些数据与一系列元数据值相关联,这些元数据值表示特定的概念,表 示标识和描述的概念 这些元数据值和概念可以理解为一个多维坐标系统的具体指定的某一个维度 该系统通常用于描述数据立方体 SDMX确定了对这种多维“立方体”结构的数据进行建模、表达和理解的一种标准技术,并且允许 对各种不同来源的数据进行自动化处理 这种方法可广泛应用于各种类型的数据,同时该方法还试图 提供最简单和最容易理解的技术 术将支持大量的数据和相关元数据集的交换 ,议此技 术语“元数据”所指的范围很广泛,这里主要分为两部分;结构元数据和引用元数据 在“结构化”元 数据与“参考”元数据之间可以做出明确的区 “结构化”元数据是用于描述和标识统计数据和 元数据的概念;而“参考”元数据是通常用于描述 和限定统计数据集和处理的概念,并且通常不与数据的 特定观测或序列相关联,但却与数据的整体采集相关联,甚至与数据的提供机构相关联 SDMX信息模型不仅规定了 “参考”元数据的结构化方法 尽管 ,而且还规定 引用元数据的结构独立于这些数据及其结构元数据,但它们的结构通常是 租石 关联的 SDMX信息模 型给出了引用元数据与数据或结构元数据的任意部分的关联关系,还给出了这些引用元数据及其结构 化描述的报告和交换 SDMX标准支持数据质量的诸多方面,其中对质量相关的元数据的支持是 SDMX支持数据质量的主要内容 元数据不仅与数据相关联,而且还与提供和管理数据流的过程相关联 SDMX信息模型规定了- 系列与“数据供应”相关的元数据集,这些元数据对于需要理解数据提供方所输出的内容和格式的人群 甚为有用 每个数据提供方都可以在自己生产的数据和元数据集内以标准方式描述它们之间的内容和
GB/T34052.1一2017 依赖关系,并给出提供这些数据和元数据的时间表和机制相关的信息 这样就可以实现校验和控制功 能的自动化,并支持数据报告的管理 SDMX也认为分类方案在组织和管理数据和元数据交换和传播中的重要性 SDMX中可以表达 有关分类方案和领域分类方面的信息,同时也表达其与数据和元数据集之间的关系,还可以在模型中对 其他对象进行分类 SDMX标准给出了通用模型和语法选择;对XML而言,它提供了支持上述所定义的任意类型的统 计数据进行交换的数据格式的选择;在sDMIX-ML中,针对每类实现中的具体需求而规定了几种最优 化的格式 图1是信息模型中对象的简单描述,其详细内容将在GB/T34052的其他部分进行规定 分类方案 概念方案 概念 代码表 由对象或 由..所约 由..所定 报告分类 束的枚举 代码 义的产物 所组成 产物 结构和代 码表映射 结构图 数据或元数据结构定义 信息模型中 能引用特 使用具体数据 过程 的分类对象 /元数据结构 定的对象 可以有子类 符合数掘/元数 据流的业务规则 数据或元数流 数据或元数据集 分类法 可以从多个数据 发布/报告数据/ /元数据提供方 元数据集 处获得数据/元 数据 以URL、注册日 期等进行注册 注朋教据或无数指架 供应协议 数据提供方 通过商定的数据 /元数据结构为 数据和元数据存 许多数据/元数 在注册 据流供应数据/ 元数据 图1SDIX信息模型中的主要产物的高阶示意图 4.4统计交换的sDMx视图 统计数据交换中“数据流”这个概念支持不间断地进行数据报告或传播 “数据流”可以理解为不受 时间限制的数据集 数据结构由机构所拥有和维护,数据流也以类似的方式由维护机构所拥有 GB/T34052允许对统计数据以及相关的结构元数据)进行发布,同时还给出了引用元数据格式 化的表示法 引用元数据并非数据集的一个不可分割部分,它独立于统计数据 sDMX给出了参考 “元数据集”“元数据结构定义”和“元数据流” 这些概念与数据集、数据结构定义和数据流非常相似 但是数据集、数据结构定义和数据流更关注统计观测,而元数据集、元数据结构定义和元数据流更关注
GB;/T34052.1一2017 引用元数据 同样地,数据提供方可以发布统计数据,也可以发布引用元数据 元数据结构定义由机构 按照与其维护数据结构定义、数据集的结构定义相类似的方式进行维护 数据和引用元数据的结构定义都将特定的统计概念与它们的表示法相关联起来,而不论这些表示 法是文本表示还是编码表示或其他表示等 在GB/T34052中,这些概念来自于特定机构所维护的“概 念方案” 当某些概念是另一些概念的泛化时,概念方案则将一系列概念汇集成组,并给出了这些概念 的定义和名称,同时还允许表达其语义关系 同一个概念方案既可以用于数据结构“键族”,也可以用于 引用元数据结构 在任意统计数据交换中以及在许多传播活动中都隐含存在着“服务水平协议”的概念,即使这个概 念没有被形式化或明确表达时也是如此 GB/T34052以术语“供应协议”表达了这个理念 数据提供 方可以向多种不同的数据流提供数据 数据流可以整合多个数据提供方所提供的数据 供应协议明确 了哪一个数据提供方通过何种数据流提供哪些数据 供应协议也同样适用于元数据流 供应协议可以按照以下方式获得各种信息;统计数据和元数据的发布时间、统计数据和元数据的主 题正如数据结构定义或引用元数据结构定义所描述的那样)以及统计数据和元数据所涵盖的时间周 期 这些信息在SDMX信息模型中被称为术语“约束” 信息模型中描述的对象简要概述如下 数据集:;以离散集合形式所组织的数据,它包括了某一特定时间周期内的观测 数据集可以理 解为共享着某一结构,并且涵盖了某一确定时间周期的相似数据的集合 b 数据结构定义(DSD);每个数据集都拥有一套结构元数据 这些结构元数据在SDMX中称之 为数据结构定义,它包括了概念是如何与数据“立方体”的度量、维度和属性相关联的信息,同 时也包括了与数据和标识性、描述性(结构性)的元数据的表示法都相关的信息 代码表:代码表枚举了一组数值,这些数值用于SDMX中的维度属性和其他结构化内容的表 示 代码表还可以包括给出了代码是如何组织成层级的其他结构元数据 d 机构方案;可以在机构方案内对机构和机构结构进行定义 维护机构、数据提供方、数据使用 方和组织单位都拥有特定的机构方案 分类方案和分类;分类方案由一个分类层级体系组成 在SDMX中,分类方案可以包括对数 据和无数据进行组织的任意类里 分类可将某一类型与某一可标识的对象相关联 通过这种 方式可以给对象集进行分类 统计专题域方案在sDM中作为分类方案来实能 概念方案;概念方案是一个可维护的概念列表,这些概念用于数据结构定义和元数据结构定义 中 存在多个概念方案 可以规定概念的“核心”表示法(例如,核心代码表或其他诸如“日期” 的表示法). 注:在使用这一概念的数据结构定义或元数据结构定义中可以忽略这种核心表示法 g 元数据集:引用元数据集是统计数据交换的SDMX视图中描述对象的一系列信息:引用元数 据集可以描述数据或数据结构定义的维护者;也可以描述发布数据的时间表;也可以描述单一 类型的、随时间流动的数据 叮以描述数据的质量等 在SDMX中,引用元数据的创建者可 送;也口 以采用其关心的任意概念,但是应给出包含这些概念的引用元数据集 元数据结构定义:;引用元数据集也拥有描述自身如何进行组织的结构元数据集 该结构元数 h 据集标识了正使用的引用元数据的概念,这些概念之间的关系(通常为层级关系),它们的表示 法结构和它们是如何进行表示的(作为自由文本、作为编码数值等),以及它们与哪些SDMIX 对象类型相关联 数据流定义:在SDMX中,数据集按照数据流定义进行报告或传播 数据流定义标识了数据 结构定义,并且可以通过分类(已组织的分类方案促进了数据的搜索与一个或多个主题域相 关联 根据报告的周期性或数据集中所允许的可能键码子集,约束还可以附加到数据流定 义中
GB/T34052.1一2017 元数据流定义;元数据流定义与数据流定义非常类似,但是它用于对元数据集进行描述、分类 和约束 k 数据提供方:生成数据或引用元数据的机构即称为数据提供方 lD 供应协议:描述数据提供方以某种方式提供数据集和元数据集的信息集 供应协议可以与数 据或元数据流定义大致相同的方式进行约束 因此,数据提供方可以阐述提供了某一特定数 据流的事实,这些数据流涵盖了地区和主题的特定集合 重要的是,供应协议以URL.的形 式)包含注册数据或元数据的实际来源 此处之所以使用“协议"这个术语,是因为这些信息可 以理解为“服务水平协议”的基础 然而,在sDMX中,供应协议是用于支持技术系统的元数 据,而不属于任何类型的合同信息(这些合同信息不包括在GB/T34052范围内. 约束:约束描述了 个个数据源或元数据源的子集,也可以提供关于数据定期发布的信息 约束 m 与数据提供方、供应协议、数据流、元数据流、数据结构定义和元数据结构定义相互关联 n 结构集;结构集给出了将结构元数据进行分组汇集,从而形成完整描述了特定的而又相互关联 的数据集和元数据之间的关系 结构集可用于对维度和属性与其他维度和属性进行相互映 射,以及对概念进行映射、对代码表进行映射和对分类方案进行映射 在同一数据“立方体” 中,即使数据没有在同一维度,结构集也可用于描述数据” 报告分类法报告分类法允许机构(可能以层级方式)将许多数据立方体或数据流定义联系起 来,从而共同形成 报告分类法支持通常由多个不同种类的 数据立方体所构成的主要报告,但也可以支持其他的采集和报告功能 根据包含在出版物中 的数据或元数据,报告分类法还可以支持诸如年鉴之类的出版物的规范 过程;过程给出了将一系列相互连接的过程步骤作为建模统计过程的方式 尽管它并不是统 p 计数据和元数据交换和传播的中心,但拥有 个共享的过程描述就可以对描述与过程相关概 念的引用元数据集进行互操作交换和传播 层级代码表;代码表支持代码层级规范 这些代码可以从代码表中进行引用,而代码表可以对 代码进行维护 因此层级代码表规定了一种或多种层级的代码结构,但没有规定这些代码 本身 结构化数据的注意事项如下 “立方体”数据是一种丰富的、多维度的结构,可以沿它的任意一个轴(或“维度”)对它进行观察 尽 管在sDMX中可以描述立方体数据的完整结构,但是SDMX的实际“数据”规范在GB/T34052中对这 些需求采用了相对简化的视图,其目的在于对传输的数据做格式化处理 在许多SDMX格式中的数据 视图主要为时间序列 也就是说,是作为沿时间维度进行组织的一系列观测数据,这样使得每个观测 的数据是按照时间逐渐出现的 然而,还有许多类型的统计数据,它们并没有按照时间序列来进行组织交换,而是沿立方体的一些 其他非时间的维度进行组织,这些数据称为“横截面”数据 SDMX支持统一的格式,而在数据集中,这 种格式表示了沿任意一种维度的数据组织方式 在这种语境下,时间序列就是这种统一格式的一个 特例 在统计数据“立方体”中,另一种结构类型通常是层级分类,它用于描述沿立方体任意维度(或坐标 轴)上的点,GB/T34052对这些层级分类进行了介绍 此外,GB/T34052提供了对立方体的不同维度之间的功能相互依赖性的表达,并且还支持对“稀 疏立方体”进行更好的处理 这也是“约束”的一个方面,约束允许对立方体区域进行划定,或允许在数 据结构定义所描述的全部键集中提供一组有效的键 结构化引用元数据的注意事项如下: 元数据结构以“概念可以组织成语义和表示法层级”这一思想为基础,而且这些层级可以构成结构 化XML报告格式的基础 SDMX-ML.中存在3种服务于以下目的的报文类型;结构化报文(提供元数
GB;/T34052.1一2017 据结构定义,通用元数据报文(为任意元数据结构定义提供单一格式)以及特定结构元数据报文(提供 -种特定元数据结构定义格式) 通常地,这种机制适用于支持对引用元数据进行报告和传播 元数据结构定义可以从概念方案中采用概念,并可以将这些概念作为元数据属性来描述如何形成 报告或传播的结构,元数据属性或者以扁平化列表,或者以层级形式出现 元数据属性包含表示法(代 码型,文本型等)以及出现次数 元数据的“目标”,也就是过程、信息、机构,交换等类,这也是所描述的 元数据的主题 由于SDMX信息模型给出了形式化的统计数据交换和传播,因此,此模型可以用作统 计数据活动中不同参与者和资源之间的拓扑结构 这样,引用元数据集的“目标”主题)和元数据流可 以通过参考此模型而描述成相应的一些标准 与数据结构一样,元数据集的通用格式给出了一种已知的文档结构,然而该结构的专用格式是专门 从元数据结构定义处衍生而来的、并且能够执行更高程度的模式校验 4.5sDMIx注册服务 为了使SDMX模型中的数据和元数据可视化,GB/T34052提供了一套注册服务的体系架构 “注 册"(可以理解为web服务中的术语)是对用于查询的元数据进行维护和存储的一种应用程序,并且可 以被网络上拥有足够访问特权的任何其他应用程序所使用(需要指出的是,访问控制机制不属于 GB/T34052的范围) 注册可以是分布式数据库或元数据注册库的索引,而元数据注册库是由统计机 构中的数据提供方所提供的数据集和引用元数据集所组成,这些元数据注册库位于因特网或类似的网 络中 注sDMx注册服务并不关心数据或引用元数据的存储 此处假设数据和引用元数据位于数据提供方的网站上 SDMX注册服务自身与数据和引用元数据的可视化相关,并且与需要访问的数据和引用元数据的信息相关, 因此注册库中注册的数据集拥有它的URL而不是数据本身 拟访问这些数据的应用程序可以通过分类方案 下钻的方式来查询注册库,以获取已注册数据源的URL,并 和数据流以数据 且随后直接从数据提供方处获取 这些数据(通过使用SDMX-ML查询消息或其他机制. SDMX不要求在实现注册库时采用任何特别的技术,相反,它规定了注册库能够支持的标准化接 口 因此,只要接口符合GB/T34052的规定,则用户可以采用其所选择的任何形式来实现符合sDMx 规范的注册库 这些接口以XML文档的形式表示,并成为SDMX-ML的组成部分 注册服务可以简要概述如下 结构元数据的维护该注册服务允许具有维护机构访问权的用户提交和修改结构元数据 在 然而,在sDMX结构中允许只提交结构化对象的 这一方面,注册起到结构元数据库的作用 “存根”,例如代码表;并且对该“存根”而言,可以引用获取的元数据实际位置,或者引用文件的 实际位置,或结构元数据源的实际位置诸如另一注册库 数据和元数据源的注册;注册服务允许拥有维护机构访问权的用户来通知数据集和引用元数 据集的存在及其位置(以便获取) 注册库存储有关这些对象的元数据,并且将元数据与结构 元数据链接起来,而结构元数据则为应用程序提供了足够的结构化信息,以便应用程序进行处 理或发现它的存在 注册库中的对象按照一个或多个分类方案进行组织和分类 查询:注册服务拥有查询注册库中所包含的元数据的接口;因此,应用程序和用户可以发现数 据集和引用元数据集、结构元数据以及与这些对象相关联的提供方/机构,还可发现对这些数 据和元数据如何获取以及如何分类等进行描述的供应方协议 订阅/通知;可以在注册库中“订阅”特定的对象;这样,一旦注册对象进行更新时,就可以将通 知发送给所有订阅者 4.6web服务 web服务允许计算机应用程序可以直接通过因特网交换数据,特别是可以通过比以往更为灵活的
GB/T34052.1一2017 方式实现模块化或分布式计算 然而,为了发挥web服务的功能,要求制定以下方面的标准;请求和提 供数据标准;表示用来打包交换数据的封装数据标准;在相互之间描述web服务的标准,以便更容易地 集成到使用了其他web服务来作为数据源的应用程序中 sSDMX以某种方式为使用了可以促进sSDMXweb服务之间互操作性的这些标准提供了指南,并且 允许创建通用客户端应用程序,而这些通用客户端应用程序可以与实施了这些指南的任意SDMIXweb 服务进行有含义的信息交流 具体而言,SDMXweb指南提供了以下几方面内容: 为基于soAP的web服务提供了标准化接口(wSDL)Web服务指南包含了一套web服务功 a 能,但是通过实施发现,这些功能还不足以支持目前正在开发的基于SDMX的web服务类 型 进一步而言,操作及其工作载荷目前均已实现了标准化(wSDL). b 为RREsItlweh服务提供了标准化接口(wADL);RESTulAPI注重简洁性 其目的不是复 制sDMX-M查询信息的完整语意的丰富性,而是将其简化以便执行标准查询的有限集合 然而,与sDMX规范其他部分的作用不同,RESTrlA只侧重于(通过HTPGET)获得 数据 标准化的常见错误代码列表出现情况如下:当使用web服务时,有必要设置 -些错误代码,在遇到 问题时这些错误代码有助于解释所出现问题的状况 sDIx信息模型 5 sDMX给出了对统计数据进行建模的方法,并且定义了用于此目的的元数据结构集 为了表示数 据和结构化的元数据,则SDMx以两种语法形式来规定格式,因此,此模型可以用作为确保不同格式之 间的转换不发生信息损失的一种机制 在SDMIx中,统计数据以“数据结构定义”进行结构化 “数据集”则由一个或多个低阶的“组”所构 成、并以这些组的相似程度为基础 每个组依次由一个或多个数据“序列”所构成 每个系列或段都有 个“键”,它是每个簇种概念的值,该值也称为“维度” 键用来标识一个或多个“观测”数据,而观测数 据通常是与观测时间和观测值(如度量)相关联的 另外,元数据可以作为描述性“属性”附加于该结构 的任意层 GB/T34052中,对代码表(枚举、数据和元数据表示法的其他模式也进行了建模 通常用于处理统计数据的“立方体”结构与sDMX信息模型中的数据结构定义概念之间存在某些 相似性 应注意;为方便进行交换对符合SDMx信息模型结构化的数据进行优化,并且有可能与那些 没有能力处理来自复杂统计系统的数据“立方体”的合作伙伴进行交换 SDMX时间序列可以理解为 “立方体”的切片 这样的切片可由键码作为标识 一个“序列”键码是由除时间以外的、主键族所规定 的所有维度的值所组成 根据结构化的SDMX数据可以重新构建和描述数据立方体,也可以根据 GB/T34052来交换这些数据库 GB/T34052还给出了引用元数据的视图;统计数据交换过程的SDMx视图中用于参考具有含义 的“对象”(数据提供方、结构、供应协议、数据流、元数据流等)的机制,并且元数据依附于该“对象”;也是 用于描述一套有含义的概念,并且可将这些概念组织成表示结构,同时指出它们的值是如何表示的机 制 这种机制以引用元数据的一个简单、层级化的视图为基础;对许多元数据系统和分类方案来说,该 引用元数据的视图是一种常用的视图 SDMX给出了一种模型和XYML格式),既可以用于描述引用 元数据结构,也可以根据这些结构报告引用元数据 GB/T34052支持与统计数据交换过程相关的元数据 GB/T34052可以对过程的步骤进行建模 也可以表达由谁提供数据和引用元数据以及他们是如何被提供的有关信息;并且还可以表达服务层协 议(以及相似类型的供应协议)的技术方面 SDMX信息模型描述了上面所列的所有对象,以便展示统计数据交换过程的标准视图 10
GB;/T34052.1一2017 SDMX信息模型通过UML进行表示,同时也以文本形式进行描述 尽管信息模型并不是标准化 的,然而它是理解和使用标准化格式规范的有价值的工具 SDMX-ED1 sSDMX-EDI格式是SDMX标准支持的一种格式,且作为SDMX的一项标准出版发行;其中: 统计定义:UN/EDIFACT格式中,对SDMX信息模型所覆盖的结构元数据所进行的表达 b 统计数据双方之间经优化的用于批量交换的大量时间序列数据,它允许对大量的整体或部 分数据集进行极为紧凑的表达 如果诸如横截面数据之类的非时间序列数据作为重新打包的 时间序列进行表示,则其可以得到支持,但是,SDMX-ED格式并没有对横截面数据提供直接 的支持 数据集列表:数据集及其结构元数据的列表 c SDMIxX信息模型给出了sDMX-EDI所使用的EDFAcT语法和sDMX-MML所使用的xML语法 中都出现的结构 由于这两种语法实施都反映了相同的逻辑结构,所以SDMIX-E:D数据和结构元数据 报文可以转换成相应的SDMX-ML格式,反之亦然 因此,SDMX-ED规定了基于UN/EDIFACT的 以及基于XML的两个系统处理以及交换统计数据和元数据之间的互操作 SDMX-ML SDMIX-EDI格式主要用于支持批量交换,而sDMxM支持着更大范围的需求 XML格式用于 许多不同类型的自动化处理,因而必然会支持更多不同的应用场景 这就是多种类型的、可用的报文都 采用sDMIX-ML格式的原因 每种类型的报文都适合于支持某一特定类的处理需求,其中 结构定义:SDMX-ML报文类型都共享着元数据(此处的元数据需理解和处理数据集和元数 据集)的通用XML表达式,并且还包含有关分类方案和机构的附加元数据 而且,数据和元 数据供应(数据流和元数据流)的结构化方面也采用此格式进行描述 公共数据SDMX-ML中表达的统计数据都可以按照此数据格式进行标记,并且与结构定义 报文的内容相一致 对于应用程序接收所需要的数据的任意场景而言,应按照单一的格式进 行设计和处理 这些应用程序在处理数据集之前,可能需要对数据集的结构进行独立访问 以这种格式标记的数据并不特别紧凑,但这些数据可以轻松获得数据集的所有内容 通过使 用通用的XML解析器,这种格式并没有在数据集与其结构定义之间提供严格的验证 它既 支持部分数据集(不断更新)的传输,又支持整个数据集的传输 同时,它还支持时间序列和横 截面用例 特定结构的数据;这种格式专用于数据集的数据结构定义(换言之,它是特定的DSD),并且遵 循结构定义报文中所定义的元数据结构和该格式的技术规范之间的映射关系而创建 这种格 式支持以XML格式进行大数据集的交换(通常情况下,数据集的大小为通用数据所表达的相 同数据的50%);通过通用的XM解析器,这种格式还提供了与DSD进行符合性的严格验 证,并且还支持部分数据集(不断更新)以及整个数据集的传输 许多XML工具和技术都对XMLSehe hema所执行的功能有所预期,其中之一就是,XML sdhema中所描述的xMI结构与xML实例中带有标志符的数据之间存在非常紧密的直接关 系 如果支持带标签数据的完整性校验,则通常认为需要强数据类型 设计这些报文类型的 目的是支持校验和其他所预期的XML.Sechema功能 公共元数据SDMX-ML格式中所有可以表示的引用元数据都可以按照SDMX-Ml进行标 记 它只执行最低程度的校验,并且稍显冗长,然而它确实支持通用软件工具和服务的创建 1
GB/T34052.1一2017 以便处理引用元数据 特定结构的元数据:对于每一种元数据结构定义,都可以创建一种该结构专用的XMl Schema, ,以执行对已报告的元数据集进行校验 这种结构的冗长度比通用元数据格式低,由 于XML标记与所报告的概念直接相关,所以这种结构适合设计用来处理某一特定类型的元 数据报告的应用程序 在XM的使用方法方面,它类似于数据所用的特定结构的数据格式 查询;数据和元数据通常在可通过web访问的数据库中进行发布 因此,有必要设立一种标 准查询文档,以便对数据库进行查询,并返回SDMX-ML数据、引用元数据或结构化报文 查 询文档是SDMIX信息模型用于web服务和数据库驱动应用程序的一种实现,它允许向使用了 这些技术的数据提供方发送标准请求 注册库;所有与SDMIX注册服务之间的可能交互都可以采用sDMX-MI接口来获得支持 除 个文档以外,所有其他文档都是基于文档的同步交换,即“请求”消息由“响应”消息来回 复 请求消息有两种基本类型;一种是“提交”,另一种是“查询”;“提交”是将元数据写人注册 服务中,而“查询”则是用于发现写人的元数据 注册交互为所有类型的供应元数据以及订阅 通知、结构元数据,数据和元数据注册都规定了格式 例外情况是(注册库)通知消息是异 步的 所有SDMX-ML格式都是同一信息模型的实现,而且所有数据和元数据报文都可以从描述数据集 或元数据集的结构化报文中推导出来,所以每一种相似的格式之间都可能拥有标准的映射 这些映射 可以在通用转换工具中实现,并且对所有SDNMXML用户都可用,而并非特别针对某一具体的数据集 的键族或元数据集的结构定义(即使所处理的某些格式可能就是如此) sDMMX-M的部分封装是特 定结构的数据和元数据格式与结构定义格式之间的映射集,根据这些映射集,所有的格式都可以推导 得到 符合性 8 本部分包含一个规范表述阐述应用程序应有哪些功能以便符合SDMx规范 这里强调了应用 程序必须能够实现的功能,以及实施者根据SDMX符合性要求所作出的一致性表述内容 g 与SDMIx面向内容指南之间的依赖关系 g.1概述 GB/T34052可以与其他SDMX指南共同使用,而这些SDMX指南与统计数据交换的内容和语义 之间存在着密切关系 SDMX信息模型与任意统计概念共同发挥着良好的作用,为促进互操作性,需 对具体的概念和术语进行标准化和协调 为了达到此目标,sDMX创建并维护着用于跨领域的概念、 术语和结构化定义的指南,其内容包括垮领域概念、元数据通用词汇表、统计专题域 9.2跨领域概念 SDMX跨领域概念是跨统计领域所使用的有关概念的内容指南 在适当情况下,使用sDMX跨领 域概念可以在采用了GB/T34052的各个组织机构之间提供更进一步促进互操作性的一个框架 统计 概念的协调不仅包括了概念的定义和概念的名称,在适当的情况下,它还包括标准代码表对统计概念的 表示,以及统计概念在数据结构定义和元数据结构定义中所扮演的角色 这个指南有着两个目的;一是提供一套可用于构造统计数据和元数据的概念核心集,以促进系统之 间的互操作性(如上所述的“结构元数据”);二是为其他类型的元数据(如上所定义的“引用元数据”)提 供一套已协调一致的概念名称和定义,以促进元数据进行更广泛地交换 12
GB;/T34052.1一2017 9.3元数据通用词汇表 元数据通用词汇表(MCV)是提供SDMX术语定义的指南,MCV可用于数据结构定义以及统计元 数据管理相关方面术语的对比和映射 实质上,它为统计术语提供了符合ISO标准的定义,这些术语可 以直接使用也可以依照此词汇表建立与其他术语系统之间的映射 这一术语集包括在GB/T34052所使 用的术语 9.4统计专题域 统计专题域是一个统计信息列表,旨在组织广泛的统计交换和分类工作 它起着标准方案的作用 依照这个方案,可以对来自不同参与方之间的分类方案进行映射,以便具有互操作性的数据和元数据进 行交换 然而,它还具有另一个作用,即允许组织相应的“域组”,且每个域都可以在其域内定义标准的 数据结构定义和概念等 这种域群现已存在于国际有关组织机构中 sDMIX将采用统计专题域列表 以促进这些域群开发各种内容标准,这些内容标准可支持在各统计域中以及跨统计域的符合SDMX的 技术系统之间的互操作 在sDMX中,统计专题域可以作为一种分类方案 13
GB/T34052.1?2017 [1]GESsMES/Ts3.0GEnerieStatisicalMESsageforTimeSeries 14

统计数据与元数据交换(SDMX)第1部分:框架GB/T34052.1-2017

统计数据是指因特定目的而对某一总体所进行的观察或测量所得到的结果,如人口普查、国民经济核算等。而元数据则是用来描述和说明这些数据的数据,包括数据的定义、来源、编码方式、有效时间等信息。

统计数据与元数据交换(SDMX)是指在不同的统计机构之间交换统计数据和元数据的标准化过程。SDMX提供了一套完整的交换模型和工具,可使各个统计机构之间实现无缝的数据交换,并能够确保数据的质量和可靠性。

SDMX的框架由以下三个主要层次构成:

  • 概念层:提供了关于统计数据和元数据的共享概念的定义和说明。
  • 逻辑层:提供了描述统计数据和元数据的各种结构和复杂度的规范。
  • 物理层:提供了关于如何交换统计数据和元数据的信息,如数据格式、协议等。

SDMX标准GB/T34052.1-2017是中国国家标准化管理委员会发布的SDMX框架标准,它规范了SDMX在中国的应用和推广。该标准包含了SDMX框架的概念、逻辑和物理层次,并定义了一系列的术语和符号。此外,该标准还提供了详细的实施指南和示例,以帮助用户更好地理解和应用SDMX标准。

总之,SDMX标准GB/T34052.1-2017为统计数据和元数据交换提供了一套完整的规范和标准,使得不同的统计机构能够更好地进行数据交换,并能够确保数据的质量和可靠性。

统计数据与元数据交换(SDMX)第1部分:框架的相关资料

和统计数据与元数据交换(SDMX)第1部分:框架类似的标准

电子商务商品口碑指数评测规范
上一篇 本文分享国家标准电子商务商品口碑指数评测规范的全文阅读和高清PDF的下载,电子商务商品口碑指数评测规范的编号:GB/T34051-2017。电子商务商品口碑指数评测规范共有6页,发布于2018-02-01
纸质印刷产品印制质量检验规范第1部分:术语
本文分享国家标准纸质印刷产品印制质量检验规范第1部分:术语的全文阅读和高清PDF的下载,纸质印刷产品印制质量检验规范第1部分:术语的编号:GB/T34053.1-2017。纸质印刷产品印制质量检验规范第1部分:术语共有13页,发布于2018-02-01 下一篇
相关推荐