国家标准 GB/20090.2一2013 代替GB/T20090.22006 信息技术先进音视频编码第2部分视频 Informmationtechnology一Advaneedcodingofaudioandvideo一Part2:Video 2013-12-31发布 2014-07-15实施国家质量监督检验检疫总局发布国家标准化管理委员会国家标准
GB/T20090.2一2013 目次前言引言范围术语和定义缩略语运算符和数学函数位流语法、解析过程和解码过程的描述编码位流的结构 5 22 位流的语法和语义解析过程 65 87 解码过程附录A(规范性附录)伪起始码 140 附录B(规范性附录档次和级别 14 附录c规范性附录位流虚拟参考解码器 148 附录D(规范性附录)基本嫡编码码表 153
GB/T20090.2一2013 前言 GB/T20090《信息技术先进音视频编码》分为以下13个部分第1部分;系统第2部分视频第3部分;音频第4部分;符合性测试; 第5部分参考软件第6部分;面向数字版权管理的可信解码器与访问协议第7部分;面向交互应用的视频编解码; 第8部分;在IP网络上传输AVs; 第9部分;AVs文件格式第10部分;移动语音和音频; 第 11部分;同步文本; 12部分;综合场景第第13部分,可重构视频编码工具集本部分为GB/T20090的第2部分本部分按照GB/T1.12009给出的规则起草本部分代替GB/T20090.2一2006《信息技术先进音视频编码第2部分;视频》本部分与GB/T20090.2一2006相比,除编辑性修改外主要技术变化如下术语和定义中增加了参考背景前向间解码图像、二元符号,二元符号串核心图像,条带集和帧内解码背景图像等术语的定义,剧除了非参考图像术语,同时为了标准术语的统一,将“比特”统一为“位",故本部分术语和定义中的填充位为GB/T20090.2一2006中的填充比特、位串为GB/T20090.22006中的比特串、位流为GB/T20090.22006中的比特流、位流缓冲区为GB/T20090.22006中的比特流缓冲区,位流顺序为GB/T20090.22006中的比特流顺序(见第2章); -增加了赖内解码背景图像(G赖)、背景参考前向帧间解码图像(S帧)的定义(见6.2.3); 增加了条带集的定义(见6.3); 增加了4×4块的定义(见6.6); -对视频序列的语法和语义做了修改(见7.1和7.2); 解析过程增加了cel(v)和ae(v)的解析过程(分别见8.3.2和8.4) -图像头解码过程增加了确定加权量化矩阵的步骤见9.2); 宏块类型增加了G帧S宏块类型的定义(见9.4.2); 宏块解码过程增加了4×4内预测模式的解码过程(见9,4.4.3); -宏块解码过程增加了加权量化矩阵的解码过程(见9.4.9) -基本嫡编码的解码过程增加了4×4块解码过程(见9.5.1.3); -增加了高级嫡编码的解码过程(见9.5.2); -逆扫描增加了4×4块逆扫描的过程(见9.5.3); -增加了量化系数预测过程的定义(见9.6); -增加了4×4块反变换的过程(见9.8.3);
GB/T20090.2一2013 增加了4×4块参考样本的获得(见9.9.5)及4×4亮度块帧内预测过程(见9.9.6); -增加了亮度1/8样本插值过程(见9.10.2.2) -增加了用于4×4块的基本嫡编码码表(见附录D); -增加了档次和级别的定义(见附录B) 本部分由全国信息技术标准化技术委员会(SAC/TC28)提出并归口本部分起草单位:科学院计算技术研究所、清华大学,浙江大学、华中科技大学,北京工业大学、中山大学,华为技术有限公司、上海广电(集团)有限公司中央研究院、北京长信嘉信息技术有限公司、武汉大学、北京大学、香港科技大学,法国电信北京代表处、中兴通讯股份有限公司、深圳市海思半导体有限公司联合信源数字音视频技术(北京)有限公司本部分主要起草人;高文,黄铁军,吴枫,何芸,虞露,梁凡、赵海武、马思伟昌岩,李国平,张志明、沈燕飞、周敏华、,贾云卫、郭红星、楼剑、熊联欢,郑莆桢、张莉,郑建毕、孙莉、毛照梢
GB/T20090.2一2013 引言 0.1 目标 GB/T20090.2是为了适应数字电视广播、数字存储媒体,网络流媒体、多媒体通信等应用中对运动图像压缩技术的需要而制定的 0.2应用本部分适用的范围包括但不限于下述领域 terrestrialtelevisionbroadcas -数字地面电视广播(DTTB,digital atine) 有线电视(CATV,CableTV); 交互存储媒体; 直播卫星视频业务(DBS,directbroadcastsatellitevideoservices); 宽带视频业务; 多嫩体邮件" cketnetworks); 分组网络的多媒体业务(MSPN,multimediaservieesonpae 实时通信业务(视频会议、可视电话等); 远程视频监控 0.3档次和级别本部分能支持多种比特率、分辨率和质量的视频压缩考虑到应用本部分时的互操作性,定义档次和级别: -档次是本部分规定的语法、语义及算法的子集; 级别是在某一档次下对语法元素和语法元素参数值的限定集合 0.4技术概述本部分采用了一系列技术来达到高效率的视频编码,包括内预测、帧间预测,变换、量化和嫡编码等间预测使用基于块的运动矢量来消除图像间的冗余;内预测使用空间预测模式来消除图像内的冗余再通过对预测残差进行变换和量化消除图像内的视觉冗余最后,运动矢量、预测模式、量化参数和变换系数用嫡编码进行压缩 0.4.1预测技术帧内预测不需要参考其他图像,采用帧内预测编码的图像可作为编码后序列的随机访问点间预测需要参考先前已解码的图像,解码的顺序可与编码器中源图像捕获处理的顺序或从解码器输出用于显示的顺序不同帧间预测中运动矢量的精度能达到1/4或1/8像素,运动矢量采用预测编码川
GB/T20090.2一2013 0.4.2图像分块本部分中视频解码过程的基本处理单元是宏块一个宏块包括一个16×16的亮度样值块和对应的色度样值块宏块可进一步划分到最小8×8或4×4的样本块来进行预测 0.4.3变换和量化变换的单元是8×8或4×4的样本块变换系数进行标量量化 0.5如何阅读本部分建议读者从第1章(范围)开始,然后转到第2章(术语和定义) 第5章描述了位流语法、解析过程和解码过程第6章定义了编码位流结构第7章(语法和语义)定义了位流的语法和语义;7.1是语法描述,定义了位流中语法元素出现顺序;7.2是语义描述,也即语法元素的范围、限制和条件第8章定义了语法元素的解析过程最后,第9章解码过程)定义了语法元素如何映射到解码样值在阅读本部分的过程中,读者还需阅读第2章(术语和定义),第3章(缩略语),第4章(运算符和数学函数)及附录 0.6相关专利情况说明本部分的发布机构提请注意,声明符合本部分时,可能涉及到8.2、9.2,9.3,9.4.2、9.4.5,9.4.6.2、 9.4.9,9.5.1,9.5.2,9.7,9.8,9.10.2,9.10.2.2,9.12和附录A相关的专利的使用本部分的发布机构对于该专利的真实性、有效性和范围无任何立场该专利持有人已向本部分的发布机构保证,他愿意同任何申请人在合理且无歧视的条款和条件下，就专利授权许可进行谈判该专利持有人的声明已在本部分的发布机构备案在本部分起草过程中,起草组织者数字音视频编解码技术标准工作组根据会员签署同意的工作组章程和有关知识产权规定以及会员在提案,审阅等期间提出的专利披露与许可声明等对标准可能涉及的专利进行了识别已经确知下表列出的专利权人持有本部分的专利专利持有人址地科学院计算技术研究所北京市海淀区中关村科学院南路6号(100080) 浙江大学浙江省杭州市浙江大学信息与通信工程研究所(310027) 华中科技大学湖北省武汉市洪山区珞瑜路1037号电子与信息工程系(430074 清华大学北京市海淀区清华大学电子工程系(100084 北京工业大学北京市朝阳区平乐园100号计算机学院(100022 华为技术有限公司广东省深圳市龙岗区坂田华为基地多媒体业务部(518057 上海广电(集团)有限公司上上海市斜土路1646号上广电中央研究院(200233 上述专利权人同意对所持有的本部分的必要专利在合理和非歧视的条款和条件基础上,通过AVS 专利池进行许可由数字音视频编解码技术标准工作组推动成立的AVS专利池管理委员会是决定专利池具体许可条款的独立机构对于专利池中的所有专利,标准实施者可通过专利池管理委员会认可的授权机构获得许可有关资料可从数字音视频编解码技术标准工作组秘书处获得,联系方法如下: 联系人:黄铁军数字音视频编解码技术标准工作组秘书长通讯地址:北京2704信箱31分箱
GB/T20090.2一2013 邮政编码:10008o 电子邮件:jhuang@pku.edu.cn 话;+10一58858303,十10-58858300-303 电传真;十10一58858301 / 网址:http: www,aVs,org,cn 请注意除上述专利外,本部分的某些内容仍可能涉及专利本部分的发布机构不承担识别这些专利的责任

GB/T20090.2一2013 信息技术先进音视频编码第2部分:视频范围 GB/T20090规定了数字音视频的压缩、解压缩、处理和表示的技术方案 GB/T20090的本部分规定了多种比特率,分辨率和质量的视频压缩方法和解码过程本部分适用于高分辨率和标雅分辨率数字电视广播、激光数字存储媒体,互联网宽带流媒体,多媒体通信等应用本部分适用于数字电视广播,交互式存储媒体,直播卫星视频业务,多媒体邮件,分组网络的多媒体业务,实时通信业务,远程视频监控等应用术语和定义下列术语和定义适用于本文件 2.1 保留reserved 定义了一些特定语法元素值用于将来对本部分的扩展注;这些值不出现在符合本部分的位流中 2.2 变长编码variablelengthcoding 个可逆的嫡编码过程,它将短的码字分配给出现频率较高的符号,将长的码字分配给出现频率较低的符号 2.3 变换系数transformcefieienm 变换域上的一个标量 2.4 编码表示enedingpresentation 数据编码后的形式 2.5 编码过程enedingprocess 产生符合本部分位流的过程注:本部分不规定该过程 2.6 编码器 encoder 编码过程的实现编码图像codedpicture -帧图像的编码表示
GB/T20090.2一2013 2.8 标志 flag 一个二值变量 2.9 补偿compensation 求由语法元素解码得到的样本残差与其对应的预测值之和 2.10 残差residual 样本或数据元素的重建值与其预测值之差 2.11 参考背景前向帧间解码图像baekgroundpredietiveforwardinterdecodedpicture S帧帧间预测中只使用前向预测解码的图像注;s帆的参考图像应是G赖 2.12 参考索引 referenceindex 解码图像缓冲区中参考图像或其中场的编号 2.13 参考图像referenepieture 解码过程中用于后续图像间预测的图像 2.14 层layer 位流中的分级结构,高层包含低层编码层由高到低依次为;序列、图像、条带,宏块和块 2.15 场field 由构成的3个样本矩阵中相间的行构成 2.16 档次proile 本部分规定的语法、语义及算法的子集 2.17 二元符号bin 组成二元符号串的符号,包括“o”和“1" 2.18 二元符号串binstrinm 有限位二元符号组成的有序序列,其最左边符号是最高有效位(MSB),最右边符号是最低有效位 L.SB). 2.19 分量eopoent 图像的3个样值矩阵(亮度和两个色度)中的一个矩阵或矩阵中的单个样值 2.20 反变换inversetransform 将变换系数矩阵转换成空域样值矩阵的过程
GB/T20090.2一2013 2.21 反量化deqantization 对量化系数缩放后得到变换系数的过程 2.22 光栅扫描 raSstersCan 将二维矩形光栅映射到一维光棚，一维光栅的人口从二维光栅的第一行开始,然后接着扫描第二行,第三行,依次类推光栅中的行从左到右扫描 2.23 核心图像corepieture 此类图像最多只使用一帕参考图像,该参考图像应是最近的随机访问点后面已正确解码的此类图像位流中此类图像后的第一个P或s帧只使用一帧参考图像 2.24 宏块macroblock 包括一个16×16的亮度样值块和对应的色度样值块 2.25 macroblockaddress 宏块地址从图像左上角的宏块开始,沿光栅扫描的顺序编号,起始号为0. 2.26 宏块行 macroblockline 从编码的图像左边界到右边界在相同的垂直位置连续的宏块,其高度是16个样本 2.27 宏块位置macrobloekpositionm 图像中一个宏块的二维坐标,表示为(r,y). 示例，如果当前图像的两场的编码数据交融出现,图像左上角的宏块(,y)=(0,o),对每个宏块列,从左到右依次加1,对每个宏块行,从上到下y依次加1 如果当前图像的两场的编码数据依次出现,第一场左上角的宏块(r,y)= 0.,0),对第一场的每个宏块列,从左到右工依次加1,对第一场的每个宏块行,从上到下y依次加l;第二场左上角的宏块(r,y)=(0,(H十31)>>5),H是图像垂直方向扫措行数,对第二场的每个宏块列,从左到右依次加1,对第二场的每个宏块行,从上到下y依次加1 2.28 后向预测backwardpredietion 用显示顺序上将来的参考图像对当前图像进行预测 2.29 划分 partitioning 将一个集合分为子集的过程集合中的每个元素属于且只属于某一个子集 2.30 级别level 在某一档次下对语法元素和语法元素参数值的限定集合 2.31 交流系数Accoerieient AC系数二维变换域上索引号不全为0的变换系数
GB/T20090.2一2013 2.32 解码处理deeodleprocessing 解析过程和解码过程 2.33 解码过程deedingproees 由语法元素产生解码图像的过程 2.34 解码器 dec0der 完成解码处理的实体 2.35 解码顺序 dleedingorder 解码过程根据图像之间的预测关系,对每帧图像解码的顺序 2.36 解码图像deeodedpiecture 解码器根据位流重建的图像 2.37 解码图像缓冲区decodedpictureburrer 保存解码图像并用于预测、输出重排序和输出定时的缓冲区 2.38 解析过程parse 由位流获得语法元素的过程 2.39 禁止 forbidden 定义了一些特定语法元素值,这些值不应出现在符合本部分的位流中注;禁止某些值的目的通常是为了避免在位流中出现伪起始码 2.40 bloek 块个M(列)×N(行)的样值矩阵或者变换系数矩阵 2.41 块扫描boekscanm 量化系数的特定串行排序方式 2.42 亮度 uma 表示亮度信号的样值矩阵或单个样值 2.43 ntization 量化参数quan nparameter 在解码过程对量化系数进行反量化的参数 2.44 量化系数guantizationcoefficient 反量化前变换系数的值
GB/T20090.2一2013 2.45 x档次解码器>proiedledter 能够解码符合某档次规定的位流的解码器 2.46 起始码startcode 长度为32二进制位的码字,其形式在整个位流中是唯一的注:起始码有多种用途,其中之一是用来标识位流语法结构的开始 2.47 前向预测forwardpredlietion 用显示顺序上过去的参考图像对当前图像进行预测 2.48 前向倾间解码图像fwrwardimterdleodedpitu ure P顿帧间预测中只使用前向预测解码的图像 2.49 色度 chroma Cr,Cb 两种色差信号的一种的样值矩阵或单个样值 2.50 视频序列 sequence 编码位流的最高层语法结构,包括一个或多个连续的编码图像 2.51 输出重排序延迟outputreorderdelay 解码位流中一帧图像到输出该解码图像之间的延迟注:这是由于图像的显示顺序和解码顺序不同造成的 2.52 输出处理过程outputproeessing 由解码图像得到输出或场的过程 2.53 输出顺序outputorder 输出解码图像的顺序,与显示顺序相同 2.54 双向预测bidireetionalpredietion 用显示顺序上过去和将来的参考图像对当前图像进行预测 2.55 双向帧间解码图像bidireetonalinterdeeodelpieture B帧帧间预测中使用双向预测解码的图像 2.56 随机访问randomaccess 从某一点而非位流起始点开始对位流解码并恢复出解码图像的能力 2.57 随机访问点 randomaccesspoint 位流中能进行随机访问的点
GB/T20090.2一2013 2.58 填充位stufingbits 编码时插人位流中的位串,在解码时被丢弃 2.59 条带sliee 按光栅扫描顺序的若干连续宏块 2.60 条带集slieeset 图像中条带索引值相同的所有条带的集合 2.61 条带头slieeheader 编码的条带的一部分,是条带中宏块公用数据元素的编码表示 2.62 跳过的宏块skippedmaeroboeck 除“跳过”指示外,无其他编码数据的宏块 2.63 图像重排序picturereordering 若解码顺序和输出顺序不同,对解码图像进行重排序的过程 2.64 位串bitstring 有限位二进制位的有序序列,其最左边位是最高有效位(MSB),最右边位是最低有效位(LsB) 2.65 位流bitstream 编码图像所形成的二进制数据流 2.66 位流缓冲区bitstreambuffer 存储位流的缓冲区 2.67 位流顺序bitstreamorder 编码图像在位流中的排列顺序,与图像解码的顺序相同 2.68 显示顺序displayorder 显示解码图像的顺序 2.69 样本sample 构成图像的基本元素 2.70 样本宽高比widthheightratio -帧图像中亮度样本列间的水平距离与行间的垂直距离之比表示为: h 式中: 水平宽度; 垂直高度
GB/T20090.2一2013 2.71 样值samplevalue 样本的幅值 2.72 游程run 在解码过程中若干连续的相同数据元素一方面指在块扫描中一个非0系数前(块扫描顺序)值为 0的系数的个数;另一方面指跳过的宏块的数目 2.73 预测predlietionm 预测过程的具体实现 2.74 预测过程predietionproeess 使用预测器对当前解码样值或者数据元素进行估计 2.75 预测值predietionxalue 在后续样值或数据元素的解码过程中,使用的先前解码的样值或数据元素的组合 2.76 语法元素syntaxelement 位流中的数据单元解析后的结果 2.77 源souree 编码前视频素材或其某些属性 2.78 运动矢量mottionvector 用于帧间预测的二维矢量,由当前图像指向参考图像,其值为当前块和参考块在图像中坐标的偏移 2.79 直流系数DCeerieient Dc系数二维变换域上索引号全为0的变换系数 2.80 顾 frame 视频信号空间信息的表示,由一个亮度样本矩阵(Y)和两个色度样本矩阵(Cb和Cr)构成 2.81 帧间编码intercodiing 使用帧间预测对宏块或图像进行编码 2.82 帧间预测interpredietiom 使用先前解码图像(或场)生成当前图像(或场)样本预测值的过程 2.83 euding 帧内编码intra 使用帧内预测对宏块或图像进行编码
GB/T20090.2一2013 2.84 帧内解码图像intradeeodedlpiecture I赖只使用帧内预测解码的图像注:如果I赖采用场编码,则第一场只使用械内预测编码 2.85 帧内解码背景图像intrudecodelbackgroundpieture G帧只使用帧内预测解码的图像注:如果G采用场编码,则第一场只使用顿内预测编码 2.86 帧内预测intrapredietion 在相同解码图像(或场)中使用先前解码的样值生成当前样本预测值的过程 2.87 字节byte 8位的位串 2.88 字节对齐bytealignment 从位流的第二进制位开始,某二进制位的位置是8的整数倍个缩略语下列缩略语适用于本文件 tstreamBufferVerifier) BBV:位流虚拟参考解码器(EBit CBR:恒定比特率(ConstantBitRate) CIF:通用中间格式(CommonIntermediateFormat I.SB:最低有效位(L.eastsignificantBit) MB:宏块(Macroblock MSB:最高有效位(MostSignificantBit) QCIF:四分之一通用中间格式(QuarterCommonlntermediateFormat) VBR;可变比特率(VariableBitRate) VLc:变长编码(VariableLengthCoding 运算符和数学函数 4.1概述本部分中使用的数学运算符和优先级与C语言使用的类似但对整型除法和算术移位操作进行了特定定义除特别说明外,约定编号和计数从0开始 4.2算术运算符算术运算符定义见表1
GB/T20090.2一2013 表1算术运算符定义定算术运算符加法运算减法运算(二元运算符)或取反(一元前缀运算符 X 乘法运算幕运算,表示a的次幕也可表示上标整除运算,沿向0的取值方向截断例如,7/4和一7/一4截断至1,一7/4和7/一4截断至除法运算,不傲截断或四舍五人除法运算,不做截断或四舍五人 rG) 自变量，取由a到(含b)的所有整数值时,函数()的累加和 %b 模运算,a除以b的余数,其中a与b都是正整数 4.3逻辑运算符逻辑运算符定义见表2 表2逻辑运算符定义定逻辑运算符 a和b之间的与逻辑运算 a和b之间的或逻辑运算逻辑非运算 4.4关系运算符关系运算符定义见表3 表3关系运算符定义关系运算符定义大于大于或等于小于小于或等于等于不等于 4.5位运算符位运算符定义见表4
GB/T20090.2一2013 表4位运算符定义位运算符与运算或运算取反运算将以2的补码整数表示的形式向右移位仅当b取正数时定义此运算将a以2的补码整数表示的形式向左移b位仅当6取正数时定义此运算 4.6赋值赋值运算定义见表5 表5赋值运算定义义赋值运算定赋值运算符递增,r十十相当于r=r+1 当用于数组下标时,在自加运算前先求变量他递减，r相当于r=r一1 当用于数组下标时,在自减运算前先求变量值自加指定值,例如.r十=3相当于.r=.r十3,r十 -3)相当于.r=.r(一3 自减指定值,例如. -=3相当于r -一3 -一3.--(一3)相当于才=！ 4.7数学函数数学函数定义如下 r;>=0 Abs(.r r;.r<0 式中: 自变量 2 Ceil(.r)=r 式中: 自变量 Clip1(.r)=Clip3(0,2"一1,c) 3 式中自变量; -样本点精度 [i;ri Clip3(i,i,r=i;.r> r;其他 10o
GB/T20090.2一2013 式中: 自变量; 下界; 上界 Median(.y,:)=上十y十=一Mm(c,Min(y.))-Max(e.Max(y.s)) (5 式中自变量; 自变量; 自变量 .; Min(r,y) 6 y; 式中: 自变量; 自变量 r;r Max(.r.y) ;. 式中: 自变量; -自变量 I;. Sign(.r 0 l;r 式中: 自变量 4.8结构关系结构关系定义见表6 表6结构关系定义定结构关系结构关系符,例如,a->b表示a是一个结构,b是a的一个成员变量位流语法、解析过程和解码过程的描述 5.1 描述方法位流语法描述方法类似C语言位流的语法元素使用粗体字表示,每个语法元素通过名字(用下划线分割的英文字母组,所有字母都是小写)、语法和语义来描述语法表和正文中语法元素的值用常规字体表示 11
GB/T20090.2一2013 某些情况下,可在语法表中应用从语法元素导出的其他变量值,这样的变量在语法表或正文中用不带下划线的小写字母和大写字母混合命名大写字母开头的变量用于解码当前以及相关的语法结构，也可用于解码后续的语法结构小写字母开头的变量只在它们所在的小节内使用语法元素值的助记符和变量值的助记符与它们的值之间的关系在正文中说明在某些情况下,二者等同使用助记符由一个或多个使用下划线分隔的字母组表示,每个字母组以大写字母开始,也可包括多个大写字母位串的长度是4的整数倍时,可使用十六进制符号表示十六进制的前缀是“Ox”,例如“Oxla”表示位串“00011010” 条件语句中0表示FALsE,非0表示TRUE. 语法表描述了所有符合本部分的位流语法的超集,附加的语法限制在相关条中说明表7给出了描述语法的伪代码例子当语法元素出现时,表示从位流中读一个数据单元表7语法描述的伪代码伪代码描述符 *语句是一个语法元素的描述符,或者说明语法元素的存在、类型和数值，下面给出两个例 SyntaXelement ue(v conditioningstatem1ent *花括号括起来的语句组是复合语句,在功能上视作单个语句 statement statement “while”语句测试condition是否为TRUE,如果为TRUE,则重复执行循环体,直到condition不为 TRUE whilecondition statement *“dowhile”语句先执行循环体一次,然后测试condition是否为TRUE,如果为TRUE,则重复执行循环体,直到condition不为TRUE. do statement whilecondition 12
GB/T20090.2一2013 表7(续代码伪描述符 *“if.else”语句首先测试condition, n,如果为TRUE,则执行primary语句,否则执行alternative 语句如果alternative语句不需要执行,结构的“dlsee”部分和相关的altermative语句可忽略 icondition primarystatement dlse alternativestatement ，“or”语句首先执行initial语句，然后测试 condition,如果conditon为TRUE,则重复执行 primary语句和subsequent语句,直到condition不为TRUE initialstatement;condition;subsequentstatenment primarystatement 解析过程和解码过程用文字和类似C语言的伪代码描述 5.2 函数以下函数用于语法描述假定解码器中存在一个位流指针,这个指针指向位流中要读取的下一个二进制位的位置函数由函数名及左右圆括号内的参数构成函数也可没有参数 byte_aligned(O 如果位流的当前位置是字节对齐的,返回TRUE,否则返回FALSE nextbits(n n,则返返回位流的随后"个二进制位.MsB在前,不改变位流指针如果剩余的二进制位少于回0 yte_aligned_next_bhits(n) 如果位流当前位置不是字节对齐的,返回位流当前位置的下一个字节开始的"个二进制位,MIsB 在前,不改变位流指针;如果位流当前位置是字节对齐的,返回位流随后的n个二进制位,MSB在前,不改变位流指针如果剩余的二进制位少于n,则返回0 nextstartcode( 在位流中寻找下一个起始码,将位流指针指向起始码前缀的第一个二进制位丽数定义见表8 表8nextstartcode函数的定义丽数定描述符 next_start_code( stufing_bit while(!byte_aligned() stufing_bhit whilenext_bits(24! 'o00000000000000000000001' stuffingbyte 00000000 13
GB/T20090.2一2013 stuffing_byte应出现在图像头之后和第一个条带起始码之前 s_end_of_sliee(O) 在位流中检测是否已达到条带的结尾,如果已到达条带的结尾,返回TRUE,否则返回FAL.SE 此函数不修改位流指针丽数定义见表9 表9is_end_of_sliee函数的定义雨数定义描述符 is_end_of_slice(O ifbyte_aligned) 0x80000001 ifnext_bits(32 returnTRUE 条带结束 else if(byte_aligned_next_bits(24 0x000001&.& is_stuffing_pattern()) 条带结束 returnTRUE returnFALsE is_stuffing_pattern(O 在位流中检测当前字节中剩下的位或在字节对齐时下一个字节是否是条带结尾填充的二进制位，如果是填充位,则返回TRUE,否则返回FAL.SE 此丽数不修改位流指针函数定义见表10. 表10is_stufrngpatter函数的定义函数定义描述符 iis_stuffing_pattern(O I<<(7一n)/n.0一7,为位流指针在当前字节的位置 ifnext_bits(8一n 偏移,n为0时位流指针指向当前字节最高位 returnTRUE; else returnFAL.SE; read_bits(n 返回位流的随后n个二进制位,MSB在前,同时位流指针前移n个二进制位如果n等于“0”,则返回0,位流指针不前移函数也用于解析过程和解码过程的描述 5.3描述符描述符表示不同语法元素的解析过程,见表11 14
GB/T20090.2一2013 表11描述符描述符明说高级饷编码的语法元素解析过程在8.4中定义 ae(v) b(8 个任意取值的字节解析过程由丽数 readbits( .8)的返回值规定变长编码的语法元素解析过程在8.3.1中定义 ce(v e4(v 变长编码的语法元素解析过程在8.3.2中定义 f(n 取特定值的连续n个二进制位解析过程由丽数readbits(n)的返回值规定 n位整数在语法表中,如果n是"",其位数由其他语法元素值确定解析过程由函数rceadl i1 bits(n)的返回值规定,该返回值用高位在前的2的补码表示用指数哥伦布码编码的语法元素解析过程在8.2中定义 me( 用指数哥伦布码编码的语法元素解析过程在8.2中定义 me4(v 连续"个“0” 解析过程由丽数rend_bhits(n)的返回值规定 r川有符号整数语法元素,用指数哥伦布码编码解析过程在8.2中定义 se(v "位无符号整数在语法表中,如果"是“",其位数由其他语法元素值确定解析过程由丽 u(n 数read_bits(n)的返回值规定,该返回值用高位在前的二进制表示无符号整数语法元素,用指数哥伦布码编码解析过程在8.2中定义 ue(v 5.4保留、禁止和标记本部分定义的位流语法中,某些语法元素的值被标注为“保留”(reserved)或“禁止”(forbidden) “保留”定义了一些特定语法元素值用于将来对本部分的扩展这些值不应出现在符合本部分的位流中 “禁止”定义了一些特定语法元素值,这些值不应出现在符合本部分的位流中 “标记”(marker_bit)指该位的值应为“1” 位流中的“保留位”(reserved_bits)表明保留了一些语法单元用于将来对本部分的扩展,解码处理应忽略这些位 “保留位”不应出现从任意字节对齐位置开始的21个以上连续的“o” 编码位流的结构 6.1视频序列 6.1.1概述视频序列是位流的最高层语法结构视频序列由序列头开始,后面跟着一个或多个编码图像,每顿图像之前应有图像头编码图像在位流中按位流顺序排列,位流顺序应与解码顺序相同解码顺序可与显示顺序不相同序列结束码表明了一个视频序列的结束 6.1.2逐行和隔行视频序列本部分支持两种序列;逐行序列和隔行序列帧由三个样本矩阵构成,包括一个亮度样本矩阵(Y)和两个色度样本矩阵(Cb和Cr) 样本矩阵元素的值为整数 Y,Cb和Cr三个分量与原始的(模拟)红、绿和蓝色信号之间的关系,包括原始信号的 15
GB/T20090.2一2013 色度和转移特性等可在位流中定义,这些信息不影响解码过程场由构成帧的三个样本矩阵中相间的行构成,即帧样本矩阵的第一行,第三行第五行,依次类推，构成一个场,称为顶场;第二行,第四行,第六行,依次类推,构成另一个场,称为底场解码器的输出是一系列或场,两之间存在着一个帧时间间隔对隔行序列而言,每帧图像的两场之间存在着一个场时间间隔对逐行序列而言,每帧图像的两场之间时间间隔为0. 6.1.3序列头视频序列头由视频序列起始码开始,后面跟着一串编码图像数据序列头可在位流中重复出现,称为重复序列头使用重复序列头的主要目的是支持对视频序列的随机访问序列头后的第一个编码图像可是1桃.G糊或s赖序列头后出现的尸糊只能参考该序列头后出现的图像在对位流进行编排或随机访问的情况下,重复序列头之前的全部数据可被丢弃,这样得到的一个新的位流仍应符合本部分 6.2 图像 6.2.1概述 -幅图像是一帧,其编码数据由图像起始码开始,到序列起始码、序列结束码或下一个图像起始码结束在位流中,隔行扫描图像的两场的编码数据可依次出现,也可交融出现两场数据的解码和显示顺序在图像头中规定图像的解码处理包括解析过程和解码过程 6.2.2图像格式 6.2.2.140:0格式对于4:0:0格式,只包括Y矩阵亮度样本位置见图1 亮度样本图14:0:0格式下亮度样本位置 6.2.2.24:2:0格式对于4;2:0格式,Cb和Cr矩阵水平和垂直方向的尺寸都只有Y矩阵的一半 Y矩阵的行数和每行样本数都应是偶数另外,如果图像两场的编码数据依次出现,则Y矩阵的行数还应能被4整除亮度和色度样本位置见图2 16
GB/T20090.2一2013 O 亮度样本色度样本图24:2:0格式下亮度和色度样本位置 6.2.2.34i2;2格式对于4:2:2格式,Cb和Cr矩阵在水平方向的尺寸只有Y矩阵的一半,在垂直方向的尺寸和Y 相同 Y矩阵的每行样本数应是偶数如果图像两场的编码数据依次出现,则Y矩阵的行数也应是偶数亮度和色度样本位置见图3 图34:;2;2格式下亮度和色度样本位置 6.2.2.44:4:4格式对于4;4;4格式,Cb和Cr矩阵在水平和垂直方向的尺寸都和Y矩阵一样如果图像两场的编码数据依次出现,则Y矩阵的行数应是偶数亮度和色度样本位置见图4 图44:4:4格式下亮度和色度样本位置 17
GB/T20090.2一2013 6.2.3图像类型本部分定义了五种解码图像 -帧内解码图像(I帧) 倾内解码背景图像(G帧); 前向帧间解码图像(P); 背景参考前向帧间解码图像(s帧) 双向帧间解码图像(B帧 6.2.4图像间的顺序如果视频序列中设有B倾,解码顺序与显示顺序相同如果视频序列中包含B赖,解码顺序与显示顺序不同,解码图像输出显示前应进行图像重排序图像重排序规则如下当前解码图像是B帧,输出由此B解码的图像当前解码图像是1赖.G锁.s就或P赖,如果存在前一个1赖.s赖或P赖的解码图像,输出前个I帧、s帧或P赖的解码图像;否则,如果存在前一个G赖的解码图像,并且应被输出,输出前一个G的解码图像;否则,不输出任何解码图像位流解码完成后,除不应被输出的G帧外,还存在未输出的解码图像,则输出该图像下列示例说明图像重排序示例1;I赖和P帜之间有两个B帜,两个连续的P帜之间也有两个B赖用图像1I预测图像4P,用图像4P和1 预测图像2B和3B 解码顺序是1l,4P,2B,3B;显示顺序是11,2B,3B,4P 编码器输人顺序 6 o 10 11 12 13 B B 解码顺序 13 11 12 B B B 解码器输出,即显示顺序 10 12 11 13 B B P B B B B B 示例2G赖和s赖或P顿之间有两个B赖,两个连续的s帧或P顿之间也有两个B顿用图像1G预测图像4P 用图像4P和1G预测图像2B和3B,用图像1G预测图像10S 解码顺序是1G,4P,2B,3B;显示顺序是1G 2B.3B.4P 编码器输人顺序 10111213 B S B B 解码顺序 13l112 B B B 解码器输出,即显示顺序 12 011 13 B B B G B 6.2.5参考图像 P帆或B最多可有两帜参考图像 P可参考前向的两帜除B帧外,在一帧中,后解码的场还可参考当前帧的另外一场 B可参考一前一后的两 S帧最多可有一帧参考图像,s帧的参考图像 18
GB/T20090.2一2013 应是最近解码的G帧运动矢量所指的参考像素可超出参考图像的边界,在这种情况下对超出参考图像边界的整数样本应使用距离该整数参考样本所指位置最近的图像内的整数样本进行边界扩展对亮度样本矩阵,参考块的像素在水平和垂直方向均不应超出参考图像边界外16个像素对色度样本矩阵如果图像格式是4:20,参考块的像素在水平和垂直方向均不应超出参考图像边界外8个像素 -如果图像格式是4;2;2,参考块的像素在水平方向不应超出参考图像边界外8个像素,在垂直方向不应超出参考图像边界外16个像素如果图像格式是4;4;4,参考块的像素在水平和垂直方向均不应超出参考图像边界外16个像素场边界扩展方法和参考图像边界扩展方法相同 6.3 条带条带是按光栅扫描顺序连续的若干宏块,条带内的宏块不应重叠,条带之间也不应重叠条带集由图像中条带集索引值相同的条带组成如果当前图像的两场数据交融出现,条带集内宏块的解码处理不应使用本图像其他条带集的数据如果禁用条带集,则条带内宏块的解码处理不应使用本图像其他条带的数据;否则条带内宏块的解码处理可使用本条带集其他条带的数据如果当前图像的两场数据依次出现,这两场数据应属于不同的条带和条带集,条带集内宏块的解码处理不应使用同一场其他条带集的数据如果禁用条带集,则条带内宏块的解码处理不应使用同一场其他条带的数据;否则条带内宏块的解码处理可使用本条带集其他条带的数据条带结构见图5 条带边界扩展方法和参考图像边界扩展方法相同连续的宏块行组成的条带图5条带结构 19
GB/T20090.2一2013 连续的宏块组成的条带图5(续条带集结构见图6 图6中A,c,D,E,F,GJ,K条带分别组成不同的条带集,EB0,B1,B2条带组成 -个条带集,H0,H1条带组成一个条带集 B0 B B: 图6条带集结构 2o0
GB/T20090.2一2013 6.4宏块图像划分为宏块,宏块左上角的点不应超出图像边界在位流中,当隔行扫描图像的两场编码数据依次出现时,任一宏块的像素应来自同一场宏块的划分见图7,这种划分用于运动补偿图7中矩形里的数字表示宏块划分后运动矢量和参考索引在位流中的顺序 2个16x8亮度块 4个8X8亮度块 2个8XI6亮度块 1个16X16亮度块和相应的色度块和相应的色度块和相应的色度块和相应的色度宏块划分) 图7宏块的划分 6.58×8块在4:0:0格式下,1个宏块包括4个8×8亮度块(Y),见图8 图中数字为宏块中8×8块的顺序号图8宏块划分为8×8块(40:0格式在4;2:0格式下,1个宏块包括4个8×8亮度块(Y)和2个8×8色度块(1个Cb,1个Cr),见图9 图中数字为宏块中8×8块的顺序号图9宏块划分为8×8块(4:2:0格式在4:212格式下,1个宏块包括4个8×8亮度块(Y)和4个8X8色度块(2个Cb,2个Cr),见图10 图中数字为宏块中8×8块的顺序号图10宏块划分为8×8块(4:2:2格式 21
GB/T20090.2一2013 在4:4:4格式下,1个宏块包括4个8×8亮度块(Y)和8个8×8色度块(4个Cb,4个Cr),见图11 图中数字为宏块中8X8块的顺序号 10 Cb 图11宏块划分为8×8块(4:4:4格式宏块中的各个8×8块在位流中出现的顺序由图8~图11中的数字规定 6.64×4块 1个8X8块包括4个4X4块,见图12 图中数字为8X8块中4X4块的顺序号图128×8块划分为4×4块宏块中的各个4×4块在位流中出现的顺序由图13中的数字规定 12 13 10 1m 14 图13宏块划分为4×4块位流的语法和语义 7.1语法描述 7.1.1起始码起始码是一组特定的位串在符合本部分的位流中,除起始码外的任何情况下都不应出现这些位串起始码由起始码前缀和起始码值构成起始码前缀是位串“o00000000000000000000001” 所有的起始码都应字节对齐起始码值是一个8位整数,用来表示起始码的类型,见表12 心

视频编码标准GB/T20090.2-2013详解

随着数字化时代的来临，视频已经成为人们生活中不可或缺的一部分。然而，要在网络上传输高质量的视频却面临着诸多挑战，例如网络带宽限制、传输延迟等问题。

GB/T20090.2-2013作为信息技术先进音视频编码标准第2部分，就是针对这些问题而制定的一套视频编码标准。该标准采用了多种先进的编码技术，可以有效地提高视频传输的质量，降低带宽消耗和传输延迟。

标准内容

GB/T20090.2-2013的标准内容主要包括以下几个方面：

视频编码：采用H.264/AVC（Advanced Video Coding）技术进行视频编码，可以大大减少视频数据传输所需的带宽，同时保证视频的质量。
视频传输：采用多种先进的视频传输协议，例如RTP（Real-time Transport Protocol）和RTCP（Real-time Transport Control Protocol），可以保证视频传输的实时性和稳定性。
误码控制：采用前向纠错（FEC）技术进行误码控制，可以在一定程度上避免数据丢失和错误。
安全保护：采用多种安全加密机制，对视频数据进行加密，从而保证数据的安全性。

应用场景

GB/T20090.2-2013广泛应用于视频通信领域，例如：

视频会议：在进行企业内部或者跨公司的视频会议时，可使用该标准进行视频编码和传输，确保视频会议的质量和流畅度。
在线教育：在进行远程在线教育时，可使用该标准进行视频编码和传输，从而提高学习体验。
网络直播：在进行网络直播时，可使用该标准进行视频编码和传输，从而保证直播的质量和流畅度。

总之，GB/T20090.2-2013作为视频编码标准，已经被广泛应用于视频通信领域，可以有效地提高视频传输的质量，为用户带来更好的视听体验。