GB/T22726-2008

多声道数字音频编解码技术规范

Specificationformultichanneldigitalaudiocodingtechnology

本文分享国家标准多声道数字音频编解码技术规范的全文阅读和高清PDF的下载,多声道数字音频编解码技术规范的编号:GB/T22726-2008。多声道数字音频编解码技术规范共有106页,发布于2009-06-012009-06-01实施
  • 中国标准分类号(CCS)L71
  • 国际标准分类号(ICS)35.040
  • 实施日期2009-06-01
  • 文件格式PDF
  • 文本页数106页
  • 文件大小2.21M

以图片形式预览多声道数字音频编解码技术规范

多声道数字音频编解码技术规范


国家标准 GB/T22726一2008 多声道数字音频编解码技术规范 Speeifieationfo”mwltichanneldigitalaudioeodingtechnology 2008-12-22发布 2009-06-01实施 国家质量监督检验检疫总局 发布 国家标准化管蹬委员会国家标准
GB/T22726一2008 目 次 前言 引言 范围 规范性引用文件 术语和定义、缩略语 3 术语和定义 3 缩略语 概述 编码 4 解码 句法结构 5.1 函数 码流 5. 2 帜 5.3 5.4艇头 5.5窗口序列 5.6码书选择及应用范围 5.7子带样本的量化因子 5.8量化步长索引 5.9和差编码决定 5.10联合强度编码比例因子 5.11比特填充 15 5.12辅助数据 15 语义 15 码流 15 帧 头 16 窗口序列 20 码书选择与应用范围 子带样本的量化因子 6 22 量化步长索引 22 和差编码决定 23 联合强度编码比例因子 23 6.10比特填充 23 6.l1辅助数据 23 解码 23 声道排放与设置 24 7.2解交叉重组
GB/T22726一2008 26 7.3重建量化单元的个数 21 7.4逆量化 7.5联合强度解码 2r 28 7.6和/差解码 7.7可变分辨率的合成滤波器组 29 7.8重建短/暂窗口函数序列 33 36 在MPEGTS中复用音频流 37 附录A资料性附录相关编码技术 37 瞬态分析 37 A.2人耳听觉模型 37 A.3全局比特分配 A.4 Huffman码的码书的选择 37 *** 39 A.5和/差编码 39 联合强度编码 附录B 规范性附录 解码用的附表 B.1量化步长表 B.2临界频带表 43 B.3解码瞬态段的长度用的Hufman码表 5 B.4解码码书选择与应用范围用的Hufman 5 B5 解码量化步长索引用的Huffman码表 53 B. 解码量化因子商数宽度用的Hufman码表 57 B" 57 解码稳态量化因子用的Huffman码表 B.8解码瞬态量化因子用的Huffman码表 75 附录c(规范性附录) 在MPEGTs中复用音频流 94 Stream_ID 94 Stream_Type 94 DRA注册描述符(DRAregistrationdeseriptor) 94 DRA音频流描述符(DRAaudiostreamdeseriptor) 94 STD音频缓冲区大小 96 字节对齐 96 附录D(资料性附录)下混合 9 97 下混合公式和系数 D.1.11/0模式 9 97 D.1.22/0L.o/Ro模式 91 D.1.32/0Lt/Rt模式 97 D.1.43/2/15.1环绕声下混合模式 98 参考文献 图1编码原理框图 图2解码原理框图 32 图3可变分辨率的合成滤波器组的窗口函数 33 图4窗口函数转换的一些例子 38 图A.1本标准的Hufman码的码书选择方法与其他技术的区别
GB/T22726一2008 39 图A.2剔除一些孤立的小码书段 表1编码 表2解码 表3特殊函数定义 表4顿结构 16 16 表了正常声道的数据结构 表,低朋增强声道的数据结向 o 表" 帧头类型 表》两种制头的区别 表9解码音频数据赖长用的比特数 表10本标准支持的采样频率 8 表1解码正常声道数用的比特数 表12解码低频增强声道数用的比特数 8 表13 8 声道设置的附加信息决定 和差编码决定 18 表1 表15: 1 联合强度编码决定 表16窗口函数索引 19 表17瞬态段的个数 表18平稳赖的瞬态段的隐含长度 20 表19第一个瞬态段的起始位置与第一个瞬态发生的位置 20 表20解码码书应用范围用的Huffman码书选择 20 21 表解码码书索引用的Hufinan码书选择 解码量化因子用的Huffman码书选择 21 表2 2: 解码打包商数所需的比特数用的Huffman码书选择 表 21 表24解码量化因子用到的变量 22 25解码量化步长索引用的Huffman码书选择 22 表 22 表2解码阳差猫码决定用到的变量 27完全不用和差编码的决定 22 表 28和差编码决定 23 表 表 29缺省正常声道设置 23 表30常见声道设置的表示 214 表31各个声道的音频数据在音频倾中的排放顺序 214 表325.1环绕的音频数据在音频帧中的排放顺序 214 表33按自然顺序排列的子带样本 25 表34按交叉重组顺序排列的子带样本 25 表35解交叉重组用到的变量 26 2r 表36重建量化单元的个数用到的变量 表37逆量化用到的变量 2 表38联合强度解码用到的变量 28 29 表39和/差解码用到的变量 33 表40在瞬态发生的位置及其前后可选择的窗口函数 36 表4重建短MDCT窗口函数序列用的变量 业
GB/T22726一2008 表B.1量化步长表 43 表B.2临界频带:8000Hz,长窗口 43 表B.3临界频带;8000Hz,短窗口 43 表B.4临界频带:11l025Hz,长窗口 表B.5临界频带;l025Hz,短窗口 44 44 临界频带:12000Hz,长窗口 表h" 裘B" 44 临界频带;12000Hz,短窗口 表B. 临界频惜100Ha.长窗口 45 表B.,临界频情100H短窗 45 45 表B.i0临界频带,200Ha长菌口 表B.I1临界频带;22050Hz,短窗口 46 表B.12 临界频带:24000Hz,长窗口 46 表B 46 13临界频带:24000Hz,短窗 表B14临界频带;32000Hz.长窗 表B.15临界频带;32000H 表B 16 临界频带:44l00Hz, 表B.17临界频带44100 48 表B 18临界频带:48000Hz 48 表B.19 000Hz 48 表B 20临界频带:88200Hz, 49 表B.21临界频带;88200Ha.短窗 46 表B.22临界频带.96000Ha,长窗口 49 表B.23临界频带;96000Hz,短窗口 50 表B.24临界频带;176400Hz,长窗口 50 B.25临界频带;176400Hz,短窗口 论 50 B.26临界频带;192000Hz,长窗口 表表 50 B.27临界频带;192000Hz,短窗口 5 表 B.28HufDec1_7x 5 表 表B.29HufDee2_64xl 5 B .30HufDec3_32xl 52 表 表B.31HufDe4_18xl 53 53 表B,.32lHufDecs_18xl 表B.33HufDec6_ll6x 53 表B.34HufDec7_l16xl 55 表B.35HufDec8_16xI 5 5 )ec916xl 表B.36HufDe 表B.37HufDecl0_8lx4 5 59 表B.38HufDeel1_25x2 59 表B.39HufDecl2_8lx2 60 表B.40HufDeel3_289x2 64 表B.4lHufDeel4_3lxl 65 表B.42HufDeel5_63xl 66 表B.43HufDecl6_127x
GB/T22726一2008 68 表B.44HufDeel7_255xl 7 表B.45HufDecl8_256xI 75 表B.46HufDeel9_8lx4 76 表B.47HufDee20_25x双 表B.48HufDec21_8lx 78 表B.49HufDec22_289戏 82 表B.50HufDec23_3lxIl 表B.51 8: HufDec24_63xl 84 表B.52HufDec25_127xIl 86 表B.53HufDec26_255xl 89 表B.54HufDec27_256xl 94 表C.1DRA注册描述符 95 表C.2DRA音频流描述符
GB/T22726一2008 前 言 本标准的附录A,附录D为资料性附录,附录B附录C为规范性附录 本标准由工业和信息化部提出 本标准由全国音频视频及多媒体系统与设备标准化技术委员会归口 本标准起草单位:广州广晟数码技术有限公司、数维科技(北京)有限公司、电子技术标准化研 究所、华录集团公司 本标准主要起草人:游余立、张新刚、徐茂、伦继好、张剔雄、闫建新、姜甜、张景平、郑楚升、张培、 张树华、张素兵、韩建国、杨震、范科峰
GB/T22726一2008 引 言 为了适应我国日益发展的数字音视频产业的需求,满足不同应用领域对高品质的多声道数字音频 信号的编码需要,特制定本标准 本标准是在自主研究开发的音频编解码算法的基础上,经过算法的优 化、软件及硬件的实现、测试验证等过程编制而成 本标准规定的多声道数字音频编解码技术可在有限容量的存储介质或有限带宽的信道上保存或传 送高质量的多声道数字音频信号 本标准规定的数字音频编解码技术方案的信号通道能保持24bit以上的精度(除了因量化而有意 舍弃的精度外) 可支持的声道设置除了常见的立体声,5.1环绕声,6.1环绕声和7.1环绕声之外,还 为未来的音频技术发展预留了空间(最多可支持64.3环绕声) 本标准可支持从8kHz到192kHa间 的标准采样频率,例如44.1kHz、48kHz及96kHz 本标准对编码比特率(码率)没有明确限制在具 体应用时可根据信道带宽和音质要求等因素来设定 本标准的发布机构提请注意如下事实,声明符合本标准时,可能使用以下涉及的相关专利 多声道数字音频编码设备及其方法(专利号20051o095898.6,美国专利申请号 US11 029722); 音频编码系统(专利申请号207o416a.5,美国专利申请号Us1/609340) 基于赖的数据的可变分辨率处理(专利申请号200710141662.0,美国专利申请号Us11/ 558917); 音频解码(专利申请号200710141661.6,美国专利申请号Us11/689371) 本标准的发布机构对于专利的范围、有效性和验证资料不提出任何看法 专利持有人已向本标准的发布机构保证,他们愿意同任何申请人在合理和非歧视的条款和条件下 就使用授权许可证进行谈判 在这方面,该专利持有人的声明已向本标准的发布机构提交 有关资料 可从以下地址获得 专利申请人或受让人;广州广晟数码技术有限公司 联系人;王先文 地址:广州市天河区能源路华南理工大学北区科技园2号楼6楼, 邮政编码510640; 电话;020-22237078:; 传真:020-22237189 请注意除上述已经识别出的专利外,本标准的某些内容有可能涉及专利 本标准的发布机构不承 担识别这些专利的责任 M
GB/T22726一2008 多声道数字音频编解码技术规范 范围 本标准规定了多声道数字音频压缩编解码技术方案,包括;码流格式(句法结构与语义)解码过程 以及各个解码技术模块的技术要求,并对采用该技术的编码部分提供了资料性的建议和实现方法 本标准适用于在有限容量的存储介质或有限眼带宽的信道上保存或传送高质量的多声道数字音频 如数字音频广播、数字电视包括卫星、地面和有线等不同传输方式,家庭音响、数字电影院、激光视盘 机、网络流媒体、个人多媒体播放器 规范性引用文件 下列文件中的条款通过本标准的引用而成为本标准的条款 凡是注日期的引用文件,其随后所有 的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究 是杏可使用这些文件的最新版本 凡是不注日期的引用文件,其最新版本适用于本标准 GB/17975.1一200o信息技术运动图像及其伴音信号的通用编码第1部分:系统(idtISO/ IEC13818-1:l996 GB/T4880.22000 语种名称代吗第2部分3字母代吗CeI5so6392.1998) ISO/IEC8859-1:l998信息技术八位单字节编码图形字符集第1部分;拉丁字母一 术语和定义,缩略语 下列术语和定义、缩略语适用于本标准 3.1术语和定义 3. .1.1 音频数据audiodata 编码后用于表示原始音频信号的比特序列数据) 3.1.2 音频样本audio sample 输人编码器或输出解码器的PCM(脉冲编码调制)样值 3.1.3 辅助数据axiliarydata 包括诸如时间码之类的不属于音频信号本身,但又与其有关系的数据 3.1.4 码流或比特流bitstream 由符合本标准的编码器产生的表示原始音频信号的比特序列 3.1.5 暂窗口函数briefwindowfunetion 总长度为256个样本,但却只用其中160个样本的MDCT改进余弦变换)的窗口函数
GB/T22726一2008 3.1.6 临界频带eritiealband 人耳对声音分辨的数学模型可用一个子带滤波器组来近似表示,该滤波器组的带宽随频率的上升 而成近似的指数上升 此滤波器组的一个子带即被称为一个临界频带 3.1.7 下混合downmix 为了获得小于N个声道数量而进行的N声道的矩阵计算,见附录D 3.1.8 倾 framme 由符合本标准的编码器产生的表示一帧音频信号的音频数据 它是构成本标准的码流的基本单 位 本标准的一个帧可涵盖128,256,512或1024个音频样本 3.1.9 赖头 frameheader 本标准的一个帧的开头部分的音频数据,包括同步字和描述音频信号的特性的字,比如采样率、正 常声道的数目、LFE(低频增强)声道数目等 3.1.10 低频增强声道lowrequeneyenhancementchannel 在多声道系统内用于低频音响效果的一个限定带宽(<300Hlz)的声道 3.1.11 长窗口函数Iongwindowfunction 长度为2048个样本的MDCT的窗口函数 3.1.12 MDCT块MMIDCTbock 应用一次MDCT所产生的 -组频城系数或子带样本 或相应地,输人McT的一组新音频样本 本标准用到的MDcT块分别包含128和1024个音频样本或子带样本 3.1.13 正常声道normalchamnel 除低频增强声道以外的声道 3.1.14 量化因子 quantizationinde% 量化子带样本所生成的以量化步长为单位的值 3.1.15 量化步长quantizationstepsize 量化子带样本用的步长 3.1.16 量化单元quantizationunit 由临界频带在频域和瞬态段在时域联合界定的一个矩形;所有在此矩形内的子带样本都属于同一 个量化单元
GB/T22726一2008 3.1.17 短窗口函数shortwindowfunetion 长度为256个样本的MDCT的窗口函数 3.1.18 辅助信息sideinformation -帧音频数据中不表示子带样本的、仅仅协助解码的字 3.1.19 稳态顿stationaryframe 没有瞬态的音频样本 3.1.20 子带样本subband Sample 应用MDCT所产生的一组频域系数 3.1.21 子带段subbandsegment 由时间界定的一段子带样本 3.1.22 同步字synchronizationword 指示音频倾的开始的字 3.1.23 瞬态段transienteluster 统计特性类似的子带段 在瞬态内,瞬态段的起始位置通常为瞬态发生的位置 在平稳帧内,整 帧音频样本或子带为一个瞬态段 3.1.24 瞬态帧transientframe -有瞬态的音频或子带样本 3.1.25 瞬态位置transientloeation 对瞬态,指示瞬态发生的位置 3.1.26 典型帧typielframe 含有1024个音频采样点的帧为典型帧 3.1.27 word 由本标准的编码器产生的音频数据的最小语义单元 缩略语 LFE(L.owFrequeneyEnhancement低频增强 MDCT(ModifiedDiscreteCosineTransform改进的离散余弦变换 PCM(PulseCodeModulation脉冲编码调制
GB/T22726一2008 概述 编码 编码的主要组成部分如图1和表1所示 附录A对其中的部分技术给出了更详细的说明 输入C样本 瞬态检测 可变分辨岸滤波器组 交义重组 听觉模型 和差编码 码 路 复 演 用 联合强度编码 全局比特分配 线性标量量化 码书选择 量化因子编码 注:实线代表音频数据,虚线代表控制/辅助信息 图1 编码原理框图 编码 编码模块 功能 瞬态检测 检测输人的P(CM样本是否含有瞬态响应 把每个声道的音频信号的PCM样本分解成子带信号 该滤波器组的时频分辨率 可变分辨率分析滤波器组 由瞬态检测的结果而定 当帜中存在瞬态时,用来重组子带样本的排列顺序以便于降低传输它们所需的总 交叉重组 比特数 人耳听觉模型 计算人耳的噪声掩蔽阂值 可选的和/差编码 把左右声道对的子带样本转换成和/差声道对 可选的联合强度编码 利用人耳在高频的声像定位特性而对联合声道的高频分量进行强度编码 全局比特分配 把比特资源分配给各个量化单元,以使它们的量化噪声功率低于人耳的掩蔽阔值 线性标量量化 利用全局比特分配提供的量化步长来量化各个量化单元内的子带样本 基于量化因子的局部统计特征对量化因子分组,并把最佳的码书从码书库中选择 码书选择 出来分配给各组量化因子 量化因子编码 利用码书选择选定的码书及其应用范围来对所有的量化因子进行Huffman编码 多路复用 把所有量化因子的Huffman码和辅助信息打包成一个完整的比特流
GB/T22726一2008 4.2解码 解码的主要组成部分如图2和表2所示 表2解码 解码模块 功能 从比特流解包出各个码字 由于Hufman码属前缀码,其解码和多路解复用是在 多路解复用 同一个步骤中完成的 从比特流中解码出用于解码量化因子用的各个Huffman码书及其应用范围(ap 码书选择 plieationrange) 量化因子解码 用于从比特流中解码出量化因子 量化单元个数重建 由码书应用范围重建各个瞬态段的量化单元的个数 逆量化 从码流中解码出所有量化单元的量化步长,并用其乘以量化因子重建子带样本 可选的联合强度解码 利用联合强度比例因子由源声道的子带样本重建联合声道的子带样本 可选的和/差解码 由和/差声道的子带样本重建左右声道的子带样本 当帧中存在瞬态时,逆转编码器对量化因子的交叉重组 逆交叉重组 对瞬态赖,根据瞬态的位置及MICT的完美重建( 条件来 PerfectReconstruction 短/暂窗口函数序列重建 重建该须用的短和暂窗口函数序列 可变分辨率合成滤波器组 由子带样本重建PCM音频样本 码书选择 量化因子解码 量化单元个数重建 逆量化 联合强度解码 码 路 和差解码 解 复 流 用 逆交叉重组 知/暂口消数序列重建 可变分辨率合成滤波器组 PCM样本输出 注:实线代表音频数据,虚线代表控制/辅助信息 图2解码原理框图 句法结构 5.1函数 对句法的描述而定义的函数见表3
GB/T22726一2008 表3特殊函数定义 丽数 定义 返回x和y的最大值 max(x,y) 返回x和y的最小值 minxy Ceil(x 返回大于或等于x的最小整数 ErrorHandling( 错误处理 Exit( 退出解码 GetHufDim(pCodeBook) 返回Huffman码书CodeBook的维数 如果Hufnman码书Codebook的码书索引是踏中(Midtreading)的,返回true;否 GetHuffMidTread(pCodeBook 则,返回false GetNumHuffCodes(pCodeBook)返回Hufman码书CodeHBook的每一维的大小(Hufman码的个数 用Huffmman码书pCodeBook从码流中进行Huffman解码 HufDee(pCodeBook) k=0; unBits=0; for(n=0;nGB/T22726一2008 表3(续 函数 定义 用HHufman码书pCodeBook从码流中进行回归Huffman解码 具体实现如下 HufDecRecursive(pCodeBook k=一l do k十十; HufDecRecursive(pCodeBook) nQndex=HufD )ec(pCodeBook); whilenQlndex==nNumCodes一l); nQlndex=k关nNumCodes一1)十nQIndex; returmnQIndex; 其中,nNumCode是1 码书Code 的每一维的大小(Hufman码的个 Huffman Bool 数 重置Huffman码书CodeBook的记忆性变量nlndex ResetHuffndex(pCodeBook,nDefault ResetHuffndexpCodeBook nDefault) nlndex=nDefault: 该记忆性变量nlndex将在HufDecDiff(pCodeBook)函数中用到 Unpack(X 从码流中解包出X比特无正负号的数 码流 码流如下所示 Bit_Stream( while(Unpack(16 =0x7FFF Frame(); 5.3 帧如下所示 Frame( FrameHeader(); for(nCh=0;nChGB/T22726一2008 ifbUseSumDif==true&.&.nCh%2)==1 UnpackSumDff():; ifbUseJIC==true8.8 nCh0 UnmpaekJicSeale() fornCh=nNumNormalCh;nChGB/T22726一2008 nNumBlocksPerFrm=1Un Jnpaeck(2) nSampleRatelndex=Unpack(4); ifnFrmHeaderType ==0 nNumNormalCh=Unpack(3)十l; nNumL.feCh=Unpaek(1); else nNumNormalCh=Unpack(6)十l; nNumLfeCh=Unpack(2); bAuxData=Unpack(1); ifnFrmHeaderType==0 ifnNumNormalCh>1) bUseSumDiff=Unpack(1); bUseJIC=Unpack(1); else UseSumD)ff=0 bUseJIC=0, ifbUseJIC==1 nJicCb=Unpack(5)+1; else DJicCb 0 else bUseSumDiff=0:; bUseJIC=0; nieCb= =0; 5.5 窗口序列 窗口序列如下所示
GB/T22726一2008 UnpackwinSee bequence( if(nCh==0lbUseJIC==false&.&.bUseSumDiff==false) nwinTypeCu urrent= -Unpack(4); if(nWinTypeCun =ANY_LONG_WIN 1rrent! nNumCluster=Unpack(2)十l; ifnNumCluster>=2 nlast=0; ornCluster=0;nClusternNumCluster一l;nCluster十十 k=HufDec(pClusterBook)+l; anNumBlocksPerFrmPerClusternCluster]=k; nlast+=k; anNumBlocksPerFrmPerCluster[nCluster]=nNumBlocksPerFrm一nlast; else anNumBlocksPerFrmPerCluster[0]=nNumBlocksPerFrm; dlse nNumCluster=l; anNumBlocksPerFrmPerCluster[o]=1; else nwimTypeCurent=Cho.nwimTypcCurenr nNunmCluster=Ch0.nNumCluster" forn=0;nGB/T22726一2008 fornCluster=0;nCluster0 nlast=Unpack(4); mnHs[nCuster][O]=nlast fornBand=l;nBand一anHSNumBands[nCluster];nBand十十 k=HuffDecode(pHSBook); ifk>8 =8; else =9 k十=nlast; mnHs[nCluster][nBand]=k nlast=k; 子带样本的量化因子 5 子带样本的量化因子如下: UnpackQndex K ResetHuffndex(pQuotientwidthBook,0) fornCluster= 0;ncl" ustern nNumCluster;nCluster++ 1l
GB/T22726一2008 nStart=anClusterBino[nCluster]; for(nBand=0;nBand0 nQuotientwidth=HufDecDiHff(pQuotientwidthBook)十1; ornBin=nStart;nBinGB/T22726?2008 else nDim=GetHufDim(pQIndexIBook); ifnDim>1 nNumCodes=GetNumHuffCodes(pQndexBook ornBin=nStart;nBinGB/T22726一2008 anQIndex[nlBin]=nQIndex; nStart=nEnd; 5.8量化步长索引 量化步长索引如下 UnpackQSteplndex( ResetHIufflndex(pQStepBook,0); fornCluster=0;nCluster0) nMaxCb=二min(nieCb,nMaxCb); if(nMaxCb> 0 anSumDffAIIOf[nCluster]=Unpack(1); 点 mDfAllOff[nCluster] anSum =0 nMaxCb;n fornBand=0;nBand nBand十十 mnSumDffOn[nCluster][nBand]=Unpack(1); 14
GB/T22726一2008 else fornBand=0;nBandGB/T22726一2008 表4帧结构 同步字 帧头 对音频信号的描述如采样率,正常的声道数,低频增强声道数邻 所有正常声道的音频数据 正常声道:;l至64个 低频增强声道:0至3个 所有低频增强声道的音频数据 比特填充 将码流中当前顿的所有未用比特全部设置为1 辅助数据 诸如时间码之类的辅助数据 表4中,一个正常声道的数据的组成部分见表5 表5正常声道的数据结构 窗口函数索引 指示MCT的窗口函数 窗口序列 瞬态段的个数 只用于瞬态帆,指示瞬态段的个数 瞬态段的长度 只用于瞬态顿,指示每个瞬态段的长度 每个瞬态段用到的Huffman码书的个数 码书个数 Hufman码书索引和应用范围 应用范围 每个Huffman码书的应用范圆 码书索引 每个Hufman码书的索引 子带样本的量化因子 所有子带样本的量化因子 量化步长索引 每个量化单元的量化步长的索引 和/差编码决定 可选地指示是否要对一个量化单元里的样本进行和/差解码 联合强度编码比例因子 可选地用于对一个量化单元里的样本进行联合强度解码 表4中,一个低频增强声道的数据的组成部分见表6 表6低频增强声道的数据结构 码书个数 指示Huffman码书的个数 Huffmman码书索引和应用范围 应用范围 每个Huffman码书的应用范围 码书索引 每个Huffman码书的索引 子带样本的量化因子 所有子带样本的量化因子 量化步长索引 每个量化单元的量化步长的索引 6.3帧头 6.3.1帧头类型nFrmeaderIype:1比特 nFrmHeaderType指示如表7所示的两种类型的帧头 表8列出了这两种头的区别 该表意味 着在用扩展帧头的帧中禁用和/差编码和联合强度编码 标准解码器只需要支持常规帧头 表7帧头类型 nFrmHeaderType 头类型 常规头 扩展头 16
GB/T22726一2008 表8两种帧头的区别 比特数 有区别的字 常规顿头 扩展赖头 nNummword 10 13 nNunmNormalCh nNumlfeCh bUseSumDif bUseJ1C nJieCb 音频数据帧长nNumword.10/13比特 nNummWord指示当前帧的音频数据从同步字(第一个字节)开始一直到比特填充字结束的长度,以 32比特的字为单位来表达 解码该字用的比特数根据表9由头的类型决定 表9解码音频数据帧长用的比特数 nFmHeaderType 解码nNumword用的比特数 10 13 6.3.3短窗DCT块数nNumBoeksPerFrm;2比特 nNumBlocksPerFrm指示一音频数据所对应的短窗MDC'T块的个数 在从码流中解出传输值 nNumBlocksPerFrmTrans后,nNunmlBlocksPerFrm的实际值应根据以下公式计算得出 nNumEBHloeksPerFrm=2atnmT 由于一个短窗MDCT块包含128个新的PCM音频样本,一帧音频数据所对应的音频PCM样本 的个数为128关nNumBlocksPerFrmm. 一个典型帧包含1024个PCM音频样本,相应的nNumBlocksPerFrm=8 若nNumBlocksPer Frm<8,则当前倾为非典型帧 标准解码器只需要支持典型帧 6. 3.4采样频率索引nSampleRatelndex:4比特 nSampleRatelndex指示音频信号的采样频率索引,其所对应的采样频率见表1o 表10本标准支持的采样频率 nSampleRatelndex 采样率/Hz 8000 11025 12000 6000 22050 24000 32000 44100 48000 88200 17
GB/T22726一2008 表10(续 nSampleRatelndex 采样率/Hz 1o 96000 1m 176400 12 192000 13 保留 14 保留 15 保留 6.3.5正常声道数nNumNormaCh3/6比特 nNumNormalch指示正常声道的个数 解码该字用的比特数根据表1由赖头的类型决定.其实 际值为从码流中解码的传输值加1 表11解码正常声道数用的比特数 nFrmHeaderType 解码nNumNormalCh用的比特数 有效范围 1至8 1至64 6.3.6低频增强声道数nNumL.feCh:1/2比特 nNum mlLfeCh指示低频增强LFE)声道的个数 解码该字用的比特数根据表12由帧头的类型 决定 表12解码低频增强声道数用的比特数 nFrmHeaderType 解码nNumL.feCh用的比特数 有效范围 0至1 0至3 声道设置附加信息决定bAuxData1比特 bAuxData指示在本帧音频数据末尾的辅助数据中是否含有关于声道设置的附加信息,如表13 所示 表13声道设置的附加信息决定 bAuxData 声道设置附加信息 无 有 6.3.8和差编码决定bLUlseSumDifr:1/0比特 bUseSumDif指示本帧是否用到了和差编码,如表14所示 该字仅在常规倾头中有效,在扩展倾 头中不出现 表14和差编码决定 bUseSumDif 和差编码 未使用 使用 6.3.9联合强度编码决定bUlseJIcC:1/0比特 bUseJIC指示本帧是否用到了联合强度编码,如表15所示 该字仅在常规帧头中有效,在扩展赖 头中不出现 18
GB/T22726一2008 表15联合强度编码决定 联合强度编码 bUseJ1IC 未使用 使用 6.3.10联合强度编码的起始临界频带nlieCb5/0比特 如果本帧用到了联合强度编码,则nJicCb指示联合强度编码的起始临界频带 该字仅在常规帧头 中有效,在扩展帧头中不出现 其实际值为从码流中解码的传输值加1 6.4窗口序列 不是所有的正常声道都含有窗口序列数据 如果没有,则需从0声道(Cho)复制这组数据 窗口函数索引nwinIypeCurrent;4比特 6.4.1 nwinTypeCurrent指示当前帧所用的MDCT窗口函数,如表16所示 表16窗口函数索引 nwinTypeCurrent 窗口函数 窗口函数的长度(样本数 wIN_LONG_lONG2LONG 2048 wN_LONG_LONG2sHORT 2048 wTIN_lL(ONG_SHORT2IL(ONG 2048 SHI(ORT2SHIORT 2048 2048 BRIEF2I(ONG 2048 WIN 2048 SH(ORT2BRIE 2048 2048 SH(ORTSHORT2SHORT 256 WINSHORTSHORT2BRIEE 10 256 1 WIN_SHORT_BRIEF2BRIEEF 256 12 WIN_SH(ORT_BRIEF2SHORT 256 表16中nwinTypeCurrent=0、1,2、3、4,5,6、7,8代表长窗口丽数即5.5中的ANY_LONG wIN),其余的代表短窗口函数 当窗口函数索引nwinTypeCurrent为9、10、11、和12时,当前帧由nNumBlocksPerFrm(多达8 个)短MDCT构成 此时MDCT的窗口函数需要根据瞬态发生的位置及MDCT的完美重建(Perfeet Reconstruetion)条件来定 详见7.8 .4.2瞬态段的个数nNumCluster:2比特 o nNumCluster指示当前帧里瞬态段的个数 表17给出了所有情况下包含典型帧和非典型)瞬 态段的个数 表17瞬态段的个数 窗口函数的长度(样本数 nNumCluster的传输值 nNumCluster的实际值瞬态段的个数 2048 未传输 256 保留 l9
GB/T22726一2008 对于典型帧,如果窗口函数指示当前帧用的是长窗口函数,则当前帧为稳态帧,瞬态段的个数隐含 为1,因此不在码流中出现(未传输);否则当前帧为瞬态,瞬态段的个数应为2或3 6.4.3瞬态段的长度anNmBlocksPerFrmPerCuster[nCluster]Hufman编码 如果当前帧为瞬态帧,则anNumlBlocksPerFrmPerCluster[nCluster]指示第nCluster个瞬态段的 长度,用MDCT块的个数表示 该字需用Huffman码码表HufDeel_7xl来解码 由此解码出的各个 瞬态段的长度可以用来重建各个瞬态段的位置 如果当前帧为平稳帧,则它不在码流中出现(未传输) 此时,瞬态段的长度由类型见6.3.3)隐 含决定,如表18所示 平稳顿的瞬态段的隐含长度 表18 赖类型 瞬态段的长度anNumtlocksPerFrmPerCuster[o 典型 1个长MC'T块 非典型帧 nNumBlocksPerFrm个短MDCT块 对于瞬态帧,除第一个瞬态段外,瞬态发生的位置由每一个瞬态段的起始位置来指示 第一个瞬态 段的起始位置是否指示瞬态发生的位置则由窗口函数索引nwWinTypeCurrent来指示 如果nwinr Tpcu 1rrent t指示的窗口函数以BRIEF开头,则第一个瞬态段的起始位置指示瞬态发生的位置;反之 亦然,如表19所示 表19第一个瞬态段的起始位置与第一个瞬态发生的位置 nWmyC urrent 第一个瞬态段的起始位置是否指示瞬态发生的位置 wIN_SHORT_BRIEF2SHORT 是 wIN_SHoRT_BRIEF2BRIEF 否 其他 6.5码书选择与应用范围 本标准对每个声道的子带样本的量化因子进行Huffman编码,以提高压缩效率 如表22所示,两 组码书被用来对子带样本的量化因子进行Hufman编码,分别对应平稳帧和瞬态帧;而每组码书又分 别由9个Hufman码书组成 因此,对每一个特定的帧,共有9个Hufman码书可用于对这些量化因 子进行Huffman编码 这些码书的选择由量化因子的局部统计特性而决定: a)根据量化因子的局部统计特性对量化因子分段; b 为每段选择最佳的码书 因此,需把这些段的个数、长度(码书的应用范围)以及所选择的码书的索引传输给解码器 这是 5.6描述的句法所完成的任务 6.5.1码书段的个数anlISNumBands[nCluster]:5比特 anHSNumBands[nCluster]指示第nCluster个瞬态段的码书段的个数 6.5.2码书的应用范围mnlHISBandEdge[nClwster][nBand]Hufman编码 个瞬态段的第nBand个码书段的长度 maHshandlEdaeCaCiuater]Iaham]"4指示第Clueter Huffman码书的应用范围) 需用表20所示的Huffman码书来解码 表20解码码书应用范围用的Hurrtman码书选择 Huffman码书(pRunl.engthBook) 恢类型 稳态 HufDee2_64xl 瞬态 HufDec3_32xl 6.5.3码书的索引mnlHs[nCuster][nBand];Hufman编码 nHs[nCluster][nBand]指示第nCluster个瞬态段的第nBand个码书段所用的Huffman码书的 mn 20
GB/T22726一2008 索引 需用表21所示的Huffman码书来解码 表21解码码书索引用的Hulffman码书选择 类型 Huffman码书(pHHSBook) 稳态 HufDec4_18xl 瞬态 HufDec5_18x! 6.6子带样本的量化因子 两组码书被用来对子带样本的量化因子进行Huffmman编码如表22所示),分别对应平稳帧和瞬 态帧;而每组码书又分别由9个uffman码书组成 表22解码量化因子用的Huffman码书选择 维数 量化因子范围 是否踏中 平稳码书组 瞬态码书组 码书索引(mnHS 不适用 不适用 不适用 HufDeel9_81x Hufneel0_81x -2,2 HufDeel1_25x2 HufDec20_25x2 是 HufDec12_8lx2 HufDec21_81x2 一4,4 是 8,8 HufDeel3_289x2 HufDec22_289x2 是 -15,15 HufDecl4_31xl HufDec23_31x! 3131 HufDeel5_63x1 HufDee24_63x! HufDe HufDe 127xl _127x -63.63 c25 -127,127 HufDecl7255xI HufDec26_255xl 否 -255,255 HuffDecl8_256xl HufIDec27_256x 表22中的码书索引9所对应的两个码书(HufDecl8_256x和HufDec27_256xl)的最大量化因 子255表示溢出(ESCAPE),即量化因子已超出了这两个码表所能表示的最大范围 为此,这些量化因 子将被进行回归编码ReeursiveIndexing),即把量化因子q用如下的方式表示 g=m关255十r" 式中: 9的商数(Quotient); 9的尾数(Remainder) 该尾数仍用码书索引9所对应的Huffman码书进行编码 但对商数则没有进行Hufman编码 而是直接打包人码流 打包商数所需的比特数则用表23所示的Hufman码书来编码: 表23解码打包商数所需的比特数用的IHutfman码书选择 Huffmman码书(pQuotientwidthBook) 类型 稳态 HuffDec8_16x HufDece916xl 瞬态 由于这两个码书(HufDee18_256xl和HHufDec27_256xl)都不是踏中(Mhidtread)的,故在传输完 它们的绝对值后,须用一比特传输它们的正负号 表22中的码书索引1到8所对应的码书都是踏中(Midtread)的,故在解码完它们的Huffman码 后需加人Offset以重建量化因子的正负号 表24是对各个变量的定义 21
GB/T22726一2008 表24解码量化因子用到的变量 变量 定义 瞬态段的个数 nNumCluster 每个瞬态段的长皮 anNumlBoeksPerFrmPerCluster[nCluste时 anClusterBino[nCluster 每个瞬态段的按交叉重组顺序排列的第一个子带样本的位置 anQlndex[nBin] 按交叉重组顺序排列的第nBin个子带样本的量化因子 QIndexBooks 表22中的平稳码书组对平稳顿)或瞬态码书组对瞬态顿 QlndexBkooks[nQSelect 第nQSelect个Hufman码书 pQIndexBook 所选择的第nQSeleet个Hufman码书 6 量化步长索引 mnQSteplndex[nCluster][nBand]指示量化单元(nCluster,nBand)的量化步长的索引 需用如表 25所示的Huffman码书来解码 表25解码量化步长索引用的IHuffman码书选择 赖类型 Hufman码书(pQstepBook HufDec6-116xl 稳态 瞬态 HufDec7-116x 在解码出该索引值后,查量化步长表(表B.1)即可获得量化步长 6.8和差编码决定 在解码时需要先为每一个瞬态段找到和声道和差声道的量化单元的个数的最大值: nMaxCb=max(anMaxAetCb4Sum[nCluster],anMaxActC[nCuster]); 其中解码和差编码决定用到的变量见表26 表26解码和差编码决定用到的变量 变量 定义 anMaxActCbSum[nCluster 和声道第nCluster个瞬态段的量化单元的个数 anMaxAerCb[nClusten 差声道(当前声道)第nCluster个瞬态段的量化单元的个数 如果用到了联合强度编码,该最大值还不能超过联合强度编码的起始临界子带 ifnJicCb>0 nMaxCb= min(nJicCb,nMaxCb); 6.8.1和差编码全不用决定nSumDffAIlOfnCluster:1比特 insumDfAoH[cutc]指示在瞬态段ncluster上是否完全不用和差编码,如表27所示 表27完全不用和差编码的决定 nSumDffAllOff 和差编码全部不用 否 是 如果nSumDfAIOf等于0,需进一步为各个量化单元从码流中解码出和差编码的决定;否则,跳 到下一个瞬态段 22

城市轨道交通照明
上一篇 本文分享国家标准城市轨道交通照明的全文阅读和高清PDF的下载,城市轨道交通照明的编号:GB/T16275-2008。城市轨道交通照明共有22页,发布于2009-06-012009-06-01实施,代替GB/T16275-1996
丁硫克百威原药
本文分享国家标准丁硫克百威原药的全文阅读和高清PDF的下载,丁硫克百威原药的编号:GB22609-2008采。丁硫克百威原药共有7页,发布于2009-06-01 下一篇
相关推荐