GB/T38548.2-2020

内容资源数字化加工第2部分:采集方法

Contentresourcesdigitization—Part2:Methodofacquisition

本文分享国家标准内容资源数字化加工第2部分:采集方法的全文阅读和高清PDF的下载,内容资源数字化加工第2部分:采集方法的编号:GB/T38548.2-2020。内容资源数字化加工第2部分:采集方法共有8页,发布于2020-10-01
  • 中国标准分类号(CCS)L70
  • 国际标准分类号(ICS)35.240.30
  • 实施日期2020-10-01
  • 文件格式PDF
  • 文本页数8页
  • 文件大小418.41KB

内容资源数字化加工第2部分:采集方法


国家标准 GB/38548.2一2020 内容资源数字化加工 第2部分:采集方法 Contenresoureesdigitization一Part2:Methodofacquisition 2020-03-06发布 2020-10-01实施 国家市场监督管理总局 发布 国家标涯花管理委员会国家标准
GB;/T38548.2一2020 目 次 前言 范围 2 术语和定义 采集对象 纸质及缩微胶片载体资源的采集与处理 4.1纸质及缩微胶片载体资源的采集流程 4.2图像存储 4.3图像文件的后续加工 模拟信号类资源的采集与处理 5.1音频类内容资源 5.2视频类内容资源 原生数字资源的采集与处理 6.1图文类 6.2音视频类 6.3其他类型 参考文献
GB;/T38548.2一2020 前 言 GB/T38548《内容资源数字化加工》分为以下6个部分 第1部分:术语; 第2部分:采集方法; 第3部分:加工规格; 第4部分:元数据; 第5部分:质量控制 第6部分;应用模式 本部分为GB/T38548的第2部分 本部分按照GB/T1.1一2009给出的规则起草 本部分由国家新闻出版署提出 本部分由全国新闻出版信息标准化技术委员会(sAc/Tc553)归口 本部分起草单位;中新金桥数字科技(北京)有限公司、电子工业出版社有限公司、中宣部机关服务 中心(中宣部信息中心),清华大学,人民卫生电子音像出版社有限公司 本部分主要起草人;赵海涛、李建伟、王德胜.刘成勇,刘勇、张沫,窦天芳、赵晨阳,石雄,黄燕云
GB;/T38548.2一2020 内容资源数字化加工 第2部分采集方法 范围 GB/T38548的本部分规定了数字内容资源的采集对象、方法及流程等 本部分适用于内容资源的数字化采集与管理 2 术语和定义 下列术语和定义适用于本文件 2.1 缩微胶片mierofilm 内容资源影像按照一定比例缩小后制作成的胶片 [GB/T38548.1一2020,定义3.6 2.2 原生数字资源natiedigitalresources 由软件工具生成的包含数字内容的资源文件 [[GB/T38548.1一2020,定义3.7] 采集对象 内容资源的原始形态通过转化、整理、存储,形成数字化的形态,实现内容资源的基础数字化目标, 为内容资源进一步的数字化加工提供数据基础 内容采集对象一般情况下包括:纸质及缩微胶片载体 资源、模拟信号类资源、原生数字资源 纸质及缩微胶片载体资源的采集与处理 4.1纸质及缩微胶片载体资源的采集流程 纸质及缩微胶片载体资源的采集流程包括: 图像采集;使用扫描仪、拍照设备等对内容资源进行扫描或拍照处理,生成相应的计算机图像 文件,宜采用通用的图像格式、无损压缩存储图像,其他技术参数见表1 表1采集图像的技术参数 色彩模式 位深度 分辨率 彩色图像 24位 不低于300DPI 8位 灰度图像 不低于600DPI b 图像处理:根据应用需求,对图像文件进行加工处理,包括:色彩还原、去除噪点、图像拼接、纠
GB/T38548.2一2020 偏、二值化等,形成可进一步进行数字化加工的数据基础 4.2图像存储 图像存储的要求包括: a 依据采集图像文件的种类或采集时间建立存储目录; b)存储目录及文件命名宜包含资源唯一标识符 4.3图像文件的后续加工 在采集结果数据基础之上,根据应用需求,可进一步对采集数据进行元数据著录、版面分析,文字识 别和校对、对象数据提取和标引、结构化加工、版式文件合成等加工处理 5 模拟信号类资源的采集与处理 5.1音频类内容资源 5.1.1音频文件采集流程 音频文件的一般采集流程包括 选取适合音频资源播放并满足动态范围、信噪比、失真度等性能指标的播放设备; a b 选取采样频率、量化位、信噪比较高且总谐波失真较低的音频卡,保证音质的真实性 c 采集参数设定,流程包括: 定义音频的采集源" 1) 2 设置参数,包括采样率,响度量化、单声道/多声道等 定义音频采集格式,宜采用BwF/wAV格式; 3 4)定义音频信号来源 输出采集音频文件 d 5.1.2音频文件存储 音频文件存储的要求包括: 应依据采集音频文件的种类或采集时间建立存储目录; a b)存储目录及文件命名宜包含资源唯一标识符 5.1.3音频文件的后续加工 根据使用场景,使用音频编辑软件对音频文件进行处理,主要包括 参数设置:采样率、量化级、,通道数、比特率等; a b) 压缩转换;编码压缩和格式转换 音频内容处理;剪辑和拼接 c d 音频效果处理;音量调整、均衡、降噪等; 元数据著录; e fD 内容标引 5.2视频类内容资源 5.2.1视频文件采集流程 视频文件的一般采集流程包括
GB;/T38548.2一2020 选取播放设备;针对不同的视频资源,选取对应播放设备进行播放;应选取具有精湛的制造工 a 艺、高水平的性能指标(画面分辨率、信噪比、失真度)的专业播放设备; b 选取采集卡:;应选取采样频率、量化位、画面分辨率、信噪比较高且总谐波失真较低的视频采集 卡,保证音质和画质的真实性 采集参数设定; c d 输出采集视频文件 5.2.2视频文件存储 视频文件存储的要求包括 应依据采集视频文件的种类或采集时间建立存储目录; aa b 存储目录及文件命名宜包含资源唯一标识符 5.2.3视频文件的加工 根据实际使用场景,使用视频编辑软件对视频文件进行处理,主要包括: 切割影像内容; a b 影像效果处理; 添加片头片尾; c d)参数设置包括视频分辨率、视频编码、率等; 元数据著录; e f 内容标引 原生数字资源的采集与处理 6.1图文类 6.1.1图文文件采集流程 图文类文件的一般采集流程包括 依据文件类型,创建时间和版本记录信息确定相应版本的排版软件; aa b 使用排版软件根据需求进行格式转换 6.1.2图文文件存储 图文类资源文件整理和存储的要求包括 应依据采集图文文件的种类或采集时间建立存储目录; b 存储目录及文件命名宜包含资鄙唯一标识符 6.1.3图文文件的后续加工 在采集的结果数据基础上,根据应用需求,可进一步对采集数据进行元数据著录、版面分析、对象数 据提取和标引、结构化加工、版式文件及流式文件合成等加工处理 6.2音视频类 6.2.1音视频文件采集流程 音视频文件的一般采集流程包括 依据文件类型,创建时间和版本记录信息确定相应版本的排版软件 a
GB/T38548.2一2020 b 使用排版软件根据需求进行格式转换 6.2.2音视频文件存储 音视频整理和存储的要求包括: 应依据采集音视频文件的种类或采集时间建立存储目录; a b 存储目录及文件命名宜包含资源唯一标识符 6.2.3音视频文件的后续加工 根据实际使用场景,使用音视频编辑软件对采集文件进行处理,主要包括 a 内容剪辑和拼接; b参数设置,包括音视频编码格式,编码率等; c 元数据著录; d 内容标引 6.3其他类型 各种已封装的对象文件,如AuoCAD设计文件,动画文件等资源使用相应软件直接采集按照统 -的规范命名及存储
GB;/T38548.2一2020 参 考文献 [1]GB/T31219.3一2014图书馆馆藏资源数字化加工规范第3部分;图像资源 [[2]GB/T38548.1一2020内容资源数字化加工第1部分:术语 [3]CY/T101.1一2014新闻出版内容资源加工规范第1部分:加工专业术语

内容资源数字化加工第2部分:采集方法GB/T38548.2-2020

一、引言

随着社会信息化进程的不断推进,内容资源的数字化加工已经成为了信息化建设中不可或缺的一部分。而在内容资源数字化加工过程中,采集是非常重要的一个环节,因为采集的质量直接影响到数字化加工后的结果。为了规范采集行为,制定统一的采集标准也就成为了必要的事情。根据国家标准GB/T38548.2-2020《内容资源数字化加工 第2部分:采集方法》的规定,采集应该遵循一定的原则和步骤,以确保采集结果的准确性和完整性。

二、采集的原则

  • 1. 采集应该依据数字化加工的需求进行;
  • 2. 采集应该遵循合法、合规的原则;
  • 3. 采集应该遵循标准化的要求;
  • 4. 采集应该保证采集结果的准确性和完整性。

三、采集的步骤

  • 1. 确定采集目标:明确需要采集的内容,如文本、图片、音频、视频等,并确定采集范围和数量。
  • 2. 确认采集源:确定采集的来源,如网站、数据库、文件夹等。
  • 3. 制定采集方案:根据采集目标和采集源,制定具体的采集方案,包括采集方式、采集工具、采集频率、采集深度等。
  • 4. 实施采集:按照采集方案进行采集。
  • 5. 整理采集结果:对采集结果进行整理,包括分类、筛选、去重等。
  • 6. 存储采集结果:将采集结果存储到指定的位置。

四、采集的方法

根据GB/T38548.2-2020的规定,采集方法包括以下几种:

  1. 1. 手工采集:手动复制、截图等方式进行采集。
  2. 2. 程序采集:通过编写脚本、使用爬虫等方式进行自动化采集。
  3. 3. 合作采集:与其他机构或个人合作进行采集。
  4. 4. 采集服务:委托专业的采集服务公司进行采集。

五、采集的注意事项

  • 1. 遵守法律法规,不得采集涉及国家安全、社会公共利益等方面的内容;
  • 2. 尊重知识产权,不得侵犯他人的知识产权;
  • 3. 不得采集违反法律法规、道德准则、社会公德等方面的内容;
  • 4. 不得采集个人隐私信息;
  • 5. 采集过程中应该合理利用网络资源,避免对网络带宽和服务器负载造成不必要的压力。

六、结论

通过本文介绍,我们了解到了内容资源数字化加工中采集的重要性以及采集的原则、步骤、方法和注意事项。在进行采集前,应该明确采集目标,选择合适的采集方式和工具,并遵守法律法规和道德准则,保证采集结果的准确性和完整性。

内容资源数字化加工第1部分:术语
上一篇 本文分享国家标准内容资源数字化加工第1部分:术语的全文阅读和高清PDF的下载,内容资源数字化加工第1部分:术语的编号:GB/T38548.1-2020。内容资源数字化加工第1部分:术语共有15页,发布于2020-10-01
内容资源数字化加工第3部分:加工规格
本文分享国家标准内容资源数字化加工第3部分:加工规格的全文阅读和高清PDF的下载,内容资源数字化加工第3部分:加工规格的编号:GB/T38548.3-2020。内容资源数字化加工第3部分:加工规格共有8页,发布于2020-10-01 下一篇
相关推荐