GB/T38548.1-2020

内容资源数字化加工第1部分:术语

Contentresourcesdigitization—Part1:Terminology

本文分享国家标准内容资源数字化加工第1部分:术语的全文阅读和高清PDF的下载,内容资源数字化加工第1部分:术语的编号:GB/T38548.1-2020。内容资源数字化加工第1部分:术语共有15页,发布于2020-10-01
  • 中国标准分类号(CCS)L70
  • 国际标准分类号(ICS)35.240.30
  • 实施日期2020-10-01
  • 文件格式PDF
  • 文本页数15页
  • 文件大小745.03KB

内容资源数字化加工第1部分:术语


国家标准 GB/38548.1一2020 内容资源数字化加工 第1部分:术语 Cmtenlrewresdligtzatin一Paurt1.Iemimvsy 2020-03-06发布 2020-10-01实施 国家市场监督管理总局 发布 国家标涯花管理委员会国家标准
GB;/T38548.1一2020 目 次 前言 范围 2 通用加工术语 加工对象术语 流程和工艺术语 规格质量术语 数据服务术语 参考文献 索引
GB;/T38548.1一2020 前 言 GB/T38548《内容资源数字化加工》分为以下6个部分 第1部分:术语; 第2部分:采集方法; 第3部分:加工规格; 第4部分:元数据; 第5部分:质量控制 第6部分;应用模式 本部分为GB/T38548的第1部分 本部分按照GB/T1.1一2009给出的规则起草 本部分由国家新闻出版署提出 本部分由全国新闻出版信息标准化技术委员会(sAc/Tc553)归口 本部分起草单位;中新金桥数字科技(北京)有限公司、电子工业出版社有限公司、中宣部机关服务 中心(中宣部信息中心),清华大学,人民卫生电子音像出版社有限公司 本部分主要起草人;赵海涛、李建伟、王德胜.刘成勇,刘勇、张沫,窦天芳、赵晨阳,石雄,黄燕云
GB;/T38548.1一2020 内容资源数字化加工 第1部分:术语 范围 GB/T38548的本部分界定了内容资源数字化加工中涉及的通用加工、加工对象,流程和工艺、规 格质量和数据服务的术语和定义 本部分适用于内容资源的数字化建设和管理 通用加工术语 2.1 字符 character 用于表示组织或控制数据的元素集合中的一个成员 示例:字符可作如下分类 类型 举例 数字 字母 图形字符 表意字 专用字符 字 符 传输控制字符 格式控制字 控制字符 代码扩充字符 设备控制字符 [[GB/T5271.4一2000,定义04.01.01 2.2 字符集characterset 不同字符(2.1)的一个有限集合,它对于给定目的是完整的 示例:GB/T1988字符集的国际基准版 [GB/T5271.4一2000,定义04.01.02] 2.3 图像分辨率imageresolutionm 图像中存储的信息量,可以有多种的衡量法 注:本部分中以每英寸的像素DPI(D )来衡量 otsPerInch hh 符号symbol 用字母、数字,象形文字或其任何组合的标识 [GB/T4894一2009,定义4.1.1.2.l6
GB/T38548.1一2020 2.5 异体字variantChinesecharacter 汉字通常写法之外的一种音同义同,只是字形笔画或结构不同的字 示例升[升、,陛],迹[跳,],泪[沪] [GB12200.1一1990,定义4.1.3.12] 2.6 系统外字outsidesystemcharacters 用户需要,但计算机当前操作系统中并不存在的汉字 [CY/T101.1一2014,定义3.3.10 2.7 乱码garbled 由于系统或软件缺乏对某种字符(2.1)编码的支持,而产生的不能正常显示阅读的混乱字符(2.1). [CY/T101.12014,定义3.3.11] 加工对象术语 3.1 内容资源contentresouree 任意载体形式、任何描述粒度的,用于记录知识并具有一定研究、学习和应用价值的内容 3.2 对象objeet 可感知或可想象的任何事物 注对象可以是物质的(如一台发动机、一张纸、一枚宝石),非物质的(如,转化率、一个项目计划),或假象的(如、 头独角兽. [GB/T18391.1一2009,定义3.2.22 3.3 文本 teXt 以字符(2.1)、符号(2.4),词、短语、段落、句子或者其他字符(2.1)排列形成的内容,用于表达意义, 其解释基本上取决于读者对于某种自然语言或者人工语言的知识 注改写GB/T4894-2009,定义4.1.1.2.4 3.4 图片image 表示事物图像的数字阵列 一个多维的采样并量化的函数由相同维数的连续图像产生 3.5 表格tale 以一定逻辑排列单元格用于显示数据、事物分类等,以便直观呈现、快速比较和引用分析的表达 形式 3.6 缩微胶片microfilm 内容资源影像按照一定比例缩小后制作成的胶片
GB;/T38548.1一2020 3.7 原生数字资源nativedigitalresourees 由软件工具生成的包含数字内容的资源文件 流程和工艺术语 4.1 数字化加工digitalprcessing 针对出版物,表单、公文、档案文献等内容资源(3.1),通过专业化的解决方案,加工成多种可编辑的 电子格式文件的活动 [CY/T101.1一2014,定义5.1.1 4.2 加工对象proeessingobjeet 数字化加工(4.1)过程中作为一个单位处理的记录信息或实物对象(3.2) [CY/T101.l一2014,定义5.1.2] 4.3 内容加工contentproeessing 将大量分散、零乱、无序的内容资源(3.1)或文献进行整理、浓缩、提炼,并按照一定的逻辑顺序和科 学体系加以编排存储,使之系统化的活动 [CY/T101.1一2014,定义5.1.3 4,4 标准作业指导书standarloperationprocedure;soP 用以指导某个具体过程技术性细节描述的可操作性文件 [CY/T101.1一2014,定义5.1.6 4.5 加工工艺proeessingtechnoloe 0gy 数字化加工(4.1)所采用的技术方法和流程 [cY/T101.1一2014,定义5,.2.1] 4.6 图像拼接imgestithit ing 将多幅来自同一场景的具有一定重叠区域的小尺寸图像,通过软件系统拼合成为一幅大型的无缝 的图像 注:改写GB/T31219.3一2014,定义3.12 4.7 数据转换dataconversion 将数据从一种表示形式变换成另一种表示形式 [CY/T101.l一2014,定义5.2.1l1] 4.8 光学字符识别optienleharacterreeognition;oCR 自动识别通过扫描仪、数码相机、摄像机等得到的图像中的字符(2.1),便于存储、编辑和检索 [GB/T31219.2一2014,定义3.4]
GB/T38548.1一2020 4.9 版面分析layoutanalysis 将扫描图像划分为不同区域块,并确定各图像区域块所需识别内容所在的区域范围的活动 [CY/T101.12014,定义5.2.14] 4.10 图像处理imageprocessing 图片处理pictureproeessing 对于对象(3.2)和数据的图像表示,为给定目的而施加任一操作的过程 示例,操作实例有景物分析,图像压缩,图像复原,图像增强、预处理、量子化,空间过滤及二维与三维对象模型的 构造 注改写GB/T5271.13一2008,定义13.01.04 4.11 无损压缩losslesscopression 去掉或减少数据中的冗余信息,但这些冗余信息可以重新插人到数据中 无损冗余压缩是可逆的 过程 [GB/T31219.3一2014,定义3.10] 5 规格质量术语 5.1 元数据metadata 关于数据或数据元素的数据(可能包括其数据的描述),以及关于数据拥有权,存取路径、访问权和 数据易变性的数据 [[GB/T5271.17一2010,定义17.06.05 5.2 著录规则deseriptiverules 著录各个事项的具体规则和方法 LCY/T101.1一2014,定义6.1.2] 5.3 都柏林核心元数据dublincoremetadata;Dc -种根据各类信息资源的共同特点确定的,适用于不同领域间信息资源、特别是网络信息资源的元 数据(5.1) [CY/T101.1一2014,定义6.1.3 5.4 内容分析cntentamalysis;subjeetanalysis 对内容及其组成部分之间关系的分析 [CY/T101.1一2014,定义6.2.5 5.5 标引indexing 根据标引规则规定的词或短语,对资源内容或形式表示的过醒 [CY/T101.1一2014,定义6.2.7]
GB;/T38548.1一2020 5.6 自动标引automaticindesing" 用计算机程序所做的标引(5.5). [CY/T101.l一2014,定义6.2.9] 5.7 数字资源对象digitalresourceobject 数字形态的资源文件的集合 5.8 数据格式dataformat 数据保存在文件或记录中的编排格式 [CY/T101.1一2014,定义6.3.2] 5.9 可移植文档格式portabledocumentformat;PDF 描述固定版式信息,与操作系统平台无关的一种电子文件格式 [CY/T101.1一2014,定义6.3.4] 5.10 版式文件ixed-layoutdoeument 排版后生成的,包含版面固化呈现需要的全部数据的一种文件 [CY/T96一2013,定义6.1.5] 5.11 流式文件reflowingdoeument 按照内容逻辑顺序,内容呈现可适应终端设备屏幕或窗口变化的一种文件 [CY/T96一2013,定义6.1.6] 5.12 电子出版文件格式 eleetronicpublication;EPub -种内容可自动重排的文件格式 [CY/T101.1一2014,定义6.3.16] 5.13 ;MathML 数学置标语言mathematicalmarkuplamguage:; -种基于XML的标准,用以描述数学符号(2.4)和公式的置标语言 [CY/T101.1一2014,定义6.3.17] 5.14 化学置标语言chemiamarkuplhamguge;CL -种基于XML的标准,用以描述化学式和公式的置标语言 5.15 数据损坏datacorruptionm 偶然或故意破坏数据的完整性 [[GB/T250692010,定义2.1l.,35 5.16 数据质量dataquality 数据在采集、加工、存贮、传输中满足相关的质量要求和指标的情况
GB/T38548.1一2020 [CY/T101.1一2014,定义6.5.1] 5.17 差错error 算出的、观察的或测量的值或状况,与真的、规定的或理论上正确的值或状况之间的差异 [GB/T5271.142008,定义14.01.08] 5.18 -致性检查 consistencycheck 确定彼此间依赖的对象(3.2)是否遵循预先约定的要求的数据验证活动 [CY/T101.1一2014,定义6.5.7 5.19 抽样sampling 从主体中选取能代表整体的一定比例的样本 [CY/T101.1一2014,定义6.5.8] 6 数据服务术语 6.1 成品数据finisheddata 已经完成全部数据处理过程且符合预先设定的规格和质量要求,可实现交付的最终数据形态 [cY/T101.1一2014,定义7.1.1 6.2 数据库database 按照概念结构组织的数据的汇集,它描述这些数据的特征及与数据对应的实体间的关系,并支持 个或多个应用领域 [GB/T5271.1一2000,定义01.08.057 6.3 内容数据库contentdatabase -定逻辑组织并集合内容的数字出版产品 按照 [CY/T962013,定义4.2.8] 6.4 电子书ebook 通过相关设备直接呈现文字,图像、音频、视频等内容的数字出版产品 注电子书包括电子图书电子期刊和电子报等 [CY/T96一2013,定义4.2.4们] 6.5 按需印刷printondemand;PoD 按照用户要求的内容和数量,在指定地点和时间,利用数码及超高速印刷技术设备进行数字印刷并 装订成册的出版方式 [CY/T101.1一2014,定义7.1.11] 6.6 知识库knowledgebase -种数据库(6.2),包含有关某领域人类经验和专家知识的推理规则和信息
GB;/T38548.1一2020 注:在自完善系统中,知识库还包括由以前所遇问题的解法产生的信息 [GB/T5271.l12000,定义01.06.18] 信息安全informationseeurity 保护、维持信息的保密性、完整性和可用性,也可包括真实性、可核查性、抗抵赖性、可靠性等性质 [[GB/T25069-2010,定义2.1.52] 6.8 数据保护dataproteetionm 采用管理或技术措施,防范未经授权访问数据 [[GB/T250692010,定义2.1.34打 6.9 访问控制aceesscontrol -种保证数据处理系统的资源,只能由被授权主体按授权方式进行访问的手段 [GB/T25069一2010,定义2.2.1.42] 6.10 数据完整性dataintegrity 数据没有遭受以未授权方式所作的更改或破坏的特性 [[GB/T25069一2010,定义2.1.36] 6.11 数据保密性dataconfidentiality 保证数据在传输过程中不会被非法用户获得的特性
GB/T38548.1一2020 参 考文献 信息与文献术语 [1]GB/T4894一2009 [27 GB/T5271.l2000 信息技术词汇第1部分:基本术语 [3]GB/T5271.一2000信息技术词汇第4部分;数据的组织 []oB/T5271.9一2001信息技术词汇 第9部分数据的传输 []GB/T5271.13一2008信息技术词汇第13部分计算机图形 [a1 GB/T5271.14一2008信息技术词汇第14部分;可靠性、可维护性与可用性 n 信息技术词汇第17部分;数据岸 GB/T5271.172010 [ GB/T12200.190汉语信息处理词汇01部分:基本术语 Lo7 GB/T18391.1一2009信息技术元数据注册系统(MDR)第1部分;框架 [10GB/T25069一200信息安全技术术语 [11]GB/31219.2一2014图书馆馆藏资源数字化加工规范第2部分文本资源 [12]GB/T31219.3一2014图书馆馆藏资源数字化加工规范第3部分;图像资源 [13]CY/T96一2013电子书内容术语 [14]CY/T101.1一2014新闻出版内容资源加工规范第1部分;加工专业术语
GB;/T38548.1一2020 索 汉语拼音索引 按需印刷 6.5可移植文档格式 5.9 版面分析 4.9流式文件 5.11 5.10乱码 版式文件 2.7 5.5 标引 标准作业指导书 4.4 5.4 表格 3.5内容分析 4.3 内容加工 6.3 内容数据库 内容资源 3.1 差错 5.17 6.1 成品数据 5.1g 抽样 数据保护 6.8 数据保密性 6.11 5.8 电子出版文件格式 5.12数据格式 6.2 6.4数据库 电子书 5.3数据损坏 5 .15 都柏林核心元数据 6.10 3.2数据完整性 对象 数据质量 5. 16 数据转换 4.7 缩微胶片 3.6 访问控制 6.9 数学置标语言 5.13 符号 2.4 数字化加工 数字资源对象 4.8 光学字符识别 图片 3.4 4.10 5.14图像处理 化学置标语言 2.3 图像分辨率 图像拼接 4.6 4.2 加工对象 4.5 加工工艺 3.3 文本 无损压缩
GB/T38548.1一2020 元数据 系统外字 2.6 信息安全 6.7知识库 6.6 5.2 著录规则 自动标引 5.6 -致性检查 5.18 字符 2.1 2.5 异体字 字符集 2.2 英文对应词索引 aceesscontrol 6.9 automaticindexing 5.6 2.1 character 2.2 character”set 5. 14 hemiealmarkuplanguage 5.,18 consistencycheck ontentanalysis 5.4 contentdatabase 6.3 4.3 cOntentpr0ceSsing 3.1 contentresource 6.11 dataconfidentiality 4.7 dataconversiom 5.,15 datacorruption datafOrmat 5.8 .10 integri 6.8 Drotection .16 5 6.2 5.2 iescriptiverules 4.1 digitalpr0ceSSing digitalresoureeojeet 5.7 Dulincoremetadata 5.3 e0ok 6.4 10
GB;/T38548.1?2020 5.12 detnoniepubikeation 5.17 error finisheddata fixed-layoutdoeumment 5.10 garbled image 3.4 4.10 magepr0ceSSlng 2.3 reSOluti0n imagestitching 4.6 5.5 indexing informationseeurity knowledgebase 6.6 ayoutanalysis 4.9 losslesscompression 5.13 mathematicalmarkuplanguage metadata 5.1 mierofilm 3.6 3.7 nativedigital reS0urceS 3.2 object 4.8 opticalcharacterrecognition 2.6 outsidesystemcharaeters portabledoeumentformat 5.9 6.5 printondemand 4.2 preessingobjeet 1
GB/T38548.1?2020 4.5 processingtechnology R relowingdocument 5.11 sampling 5.19 4.4 standardoperationDr0cedure 5.4 subjectanalysis symbol 2.4 table 3.5 3.3 teXxt 2.5 variantChinesecharacter 12

内容资源数字化加工第1部分:术语GB/T38548.1-2020解读

根据该标准,我们可以了解到下列与内容资源数字化加工相关的术语:

数字化加工

数字化加工是指将传统的纸质或模拟的信息资源通过特定的技术手段转换为数字形式的过程。

原件

原件是指在进行数字化加工前所拥有的物理实体,比如书籍、报纸、手稿等。

数字化件

数字化件是指经过数字化加工后生成的电子文件,包括扫描件、OCR件、元数据、二进制对象等。

OCR件

OCR(Optical Character Recognition)件是指通过光学字符识别技术将原件中的文字部分转换为可编辑的电子文件。

元数据

元数据是指描述数字化件内容和特征的信息,包括文档类型、尺寸、颜色、清晰度等。

二进制对象

二进制对象是指数字化件中的非文本信息,如音频、视频、图片等。

结语

随着信息技术的不断进步,内容资源数字化加工已成为机构和企业管理以及文化遗产保护中必不可少的一项工作。而掌握《内容资源数字化加工 第1部分:术语GB/T38548.1-2020》中所涉及的术语,则有助于我们更准确地理解和使用相关概念,进而提高数字化加工的效率和质量。

和内容资源数字化加工第1部分:术语类似的标准

人类工效学照明术语

钻探工程名词术语

岩溶地质术语

旅游度假租赁公寓基本要求
上一篇 本文分享国家标准旅游度假租赁公寓基本要求的全文阅读和高清PDF的下载,旅游度假租赁公寓基本要求的编号:GB/T38547-2020。旅游度假租赁公寓基本要求共有10页,发布于2020-03-06
内容资源数字化加工第2部分:采集方法
本文分享国家标准内容资源数字化加工第2部分:采集方法的全文阅读和高清PDF的下载,内容资源数字化加工第2部分:采集方法的编号:GB/T38548.2-2020。内容资源数字化加工第2部分:采集方法共有8页,发布于2020-10-01 下一篇
相关推荐