作 者:本网综合
AVS1-P2视频标准采用经典的混合编码框架,如图1所示。此框架与以往视频标准相同,但由于不同标准制订时出于对不同应用的考虑,在技术取舍上对复杂度-性能的衡量指标各不相同,因而在复杂性、编码效率上的表现也各不相同。比如,一般认为H.264的编码器大概比MPEG-2复杂9倍,而AVS视频标准则由于编码模块中的各项技术复杂度都有所降低,其编码器复杂度大致为MPEG-2的6倍,但编码高清序列AVS视频标准具有与H.264相近的编码效率。
在图1所示框架下,视频编码的基本流程为:将视频序列的每一帧划分为固定大小的宏块,通常为16×16像素的亮度分量及2个8×8像素的色度分量(对于4?誜2?誜0格式视频),之后以宏块为单位进行编码。对视频序列的第一帧及场景切换帧或者随机读取帧采用I帧编码方式,I帧编码只利用当前帧内的像素作空间预测,类似于JPEG图像编码方式。其大致过程为,利用帧内先前已经编码块中的像素对当前块内的像素值作出预测(对应图1中的帧内预测模块),将预测值与原始视频信号作差运算得到预测残差,再对预测残差进行变换、量化及熵编码形成编码码流。对其余帧采用帧间编码方式,包括前向预测P帧和双向预测B帧,帧间编码是对当前帧内的块在先前已编码帧中寻找最相似块(运动估计)作为当前块的预测值(运动补偿),之后如I帧的编码过程对预测残差进行编码。编码器中还内含一个解码器,如图1中青绿色部分所示。内嵌解码器模拟解码过程,以获得解码重构图像,作为编码下一帧或下一块的预测参考。解码步骤包括对变换量化后的系数进行反量化、反变换,得到预测残差,之后预测残差与预测值相加,经滤波去除块效应后得到解码重构图像。以上编码框架包含如下关键技术:
帧内预测
多参考帧预测
变块大小运动补偿
1/4像素插值
整数变换量化
高效B帧编码模式
熵编码
环路滤波
1.2AVS关键技术介绍
(1)帧内预测
AVS视频标准采用空域内的多方向帧内预测技术。以往的编码标准都是在频域内进行帧内预测,如MPEG-2的直流系数(DC)差分预测、MPEG-4的DC及高频系数(AC)预测。基于空域多方向的帧内预测提高了预测精度,从而提高了编码效率。AVC/H.264标准也采用了这一技术,其预测块大小为4×4及16×16,其中4×4帧内预测时有9种模式,16×16帧内预测时有4种模式。AVS视频标准的帧内预测基于8×8块大小,亮度分量只有5种预测模式,大大降低了帧内预测模式决策的计算复杂度,但性能与AVC/H.264十分接近。除了预测块尺寸及模式种类的不同外,AVS视频的帧内预测还对相邻像素进行了滤波处理来去除噪声。关于帧内预测技术的详细描述参见文献[2]。
(2)变块大小运动补偿
变块大小运动补偿是提高运动预测精确度的重要手段之一,对提高编码效率起重要作用。在以前的编码标准MPEG-1、MPEG-2中,运动预测都是基于16×16的宏块进行的(MPEG-2隔行编码支持16×8划分),在MPEG-4中添加了8×8块划分模式,而在H.264中则进一步添加了16×8、8×16、8×4、4×8、4×4等划分模式。但实验数据表明小于8×8块的划分模式对低分辨率编码效率影响较大,而对于高分辨率编码则影响甚微,如图2所示。在高清序列上的大量实验数据表明,去掉8×8以下大小块的运动预测模式,整体性能降低2%~4%,但其编码复杂度则可降低30%~40%。因此在AVS1-P2中将最小宏块划分限制为8×8,这一限制大大降低了编解码器的复杂度。