毕业设计论文外文文献翻译 H.264AVCControl Volume 中英文对照.doc

资源描述

《毕业设计论文外文文献翻译 H.264AVCControl Volume 中英文对照.doc》由会员分享，可在线阅读，更多相关《毕业设计论文外文文献翻译 H.264AVCControl Volume 中英文对照.doc（21页珍藏版）》请在三一办公上搜索。

1、文献翻译H.264/AVC编码器的一种新的快速帧内预测模式决策算法摘要：H.264/AVC视频编码标准，包含了多项先进功能。在这项新的标准中引入的新功能就包含了多个内部模式预测。其功能是开拓了具有方向性的帧内预测相邻块之间的空间相关性。H.264/AVC的帧内编码的这个新功能，他比其他压缩标准在编码效率上有相当高的改善，但是当香槟力率失真优化（RDO）算法用于时计算复杂度显着增加。在本文中，我们提出了减少H.264视频编码复杂性的一个新的快速的帧内预测模式决策方法。亮度帧内预测，该方法包括两个步骤：第一步，我们为RDO的帧内4x4块等四个模式，根据这些与相邻的堡垒相关RDO的成本分配模式和理念

2、，我们选择的帧内44块的最佳模式。第二步，我们基于一个事实，即在一个较小的块的主导方向与更大块是类似，8x8块和16x16宏块的候选模式是确定的。因此，在色度帧内预测情况下，色度像素值的方差比亮度的小得多，因为我们只使用DC模式。实验结果表明，新的快速帧内模式决策算法可在峰值信噪比（PSNR）损失忽略不计的情况下增加帧内编码速度。关键词：帧内预测，H265/AVC，视频编码，编码器复杂性1、简介新兴的视频编码标准H.264，这是由ITU-T和MPEG共同开发，它提供了最先进的视频编码技术，以满足广泛的应用1,2,3。H.264提供了比以前的视频编码标准，如H.263+和MPEG-44,5,

3、6，在相同比特率下从更好的的峰值信噪比（PSNR）和视觉质量方面有着显著改善7。它的完成主要是对可变块大小的运动补偿，多帧参考，整数变换近似离散余弦变换（DCT），在环路去块滤波器，基于上下文的自适应二进制算术编码（CABAC），而且也是为了更好地利用可能存在于内片中相邻宏块和多个帧内预测模式之间的空间相关性8。H.264视频编码标准支持各种大小块的帧内预测。亮度信号的编码，一个16X16宏可能会被作为一个整体使用的内部16x16模式预测，或可以作为单独的4x4块使用九个内的4x4模式的预测。在支持保真度范围扩展（FRExt）工具的配置文件中，宏块也可能作为单独使用的9个内部的8x8模式的8x

4、8块进行预测10。色度信号的帧内预测使用了和内部16x16的亮度预测类似的技术。在H.264帧内预测模式中选择RD优化（RDO）技术11使用，来实现编码效率。然而，在RD检测2中自编码器编码所有可能的方式中寻找最佳模式，详尽的目标块的RDO技术的计算复杂度是非常高的，它使H.264/AVC如移动设备般很难申请低的计算能力。为了减少H264/AVC的计算复杂度，当前大量的研究是倾向于研究运动估计，H.264 /AVC视频编码帧内模式预测和帧间模式预测的快速计算12,.,17。在本文中，我们提出了一种新的快速帧内预测模式的选择来在几乎不牺牲RDO性能下提高编码速度。这种方法基于每块的预测模式与这些

5、相邻的预测模式关联性和一个较小块的主导方向与较大块相类似这一事实的想法。根据这些想法，我们仅有四个模式的亮度帧内44块和最佳模式的亮度帧内44块的RD成本被选中为这些模式的研发成本的分布基础。因此，8x8块和16x16宏块的候选模式，确定为所使用的第二种想法。为了证明我们所提出的方法，与JM编码器基于在计算时间上，PSNR和各种序列比特率的差异上的比较进行实验。实验结果表明我们的算法可以峰值信号信噪比损失忽略不计的情况下显着增加帧内编码速度。本文的其余部分组织如下：第2节介绍H.264/AVC帧内模式决策。第3节我们提出了详细的快速帧内预测算法。第4节给出了实验结果表明该算法的性能。最后，本文

6、在第五节中总结。2、H.264/AVC帧内模式决策H.264标准利用相邻的帧内预测宏块/块的空间相关性。在JVT中，当前宏块被更早被解码的上方，左边宏块的相邻像素所预测。在亮度预测的样本中，预测块可能会形成为各个44子块，各个8x8块，或一个16x16宏块。从9种预测模式的4x4和8x8亮度块，4种模式的1616亮度块和4种模式的色度块中选择一个案例。为了充分利用这些模式，H.264编码器可以选择采用率失真优化（RDO）的最佳模式。2.1 4X4的亮度帧内预测模式在4X4帧内预测模式中，每个4x4块的亮度样本值是从邻近的像素的下面或左边的一个4X4块预测得到的，由图1和表1（包括DC预测类型编

7、号为2的模式，图中未显示）所示，编码器可以选择九个不同的方向进行预测。每个预测的方向对应于特定的有空间依赖的线性组合，每个输入样本的预测使用先前解码的样本集。作说明的目的，图1（a）显示4x4块的像素a, b, c .p，属于一个宏块用于编码。像素A，B，C. H和I，J，K，L，已经编码在当前4X4块的像素预测中计算相邻像素。表 1 4X4 帧内预测模式编号4X4帧内预测模式0垂直模式1水平模式2DC模式3下左对角线模式4下右对角线模式5右垂直模式6下水平模式7左垂直模式8上水平模式图1（b），显示了九种4x4帧内预测模式。模式2（DC）中，所有像素（标示a至p）通过（A+B+C+D +I+

8、J+K+L）/8预测。模式0指定的垂直预测模式，从A预测像素（标记为a,e,i和m），从B预测像素（标记为b,f,j和n），依此类推。如果采用横向预测（模式1），从E预测a,b,c,d，从F预测e,f,g,h等。模式3（下左对角线），模式4（下右对角线），模式5（右垂直），模式6（下水平），模式7（左垂直）和模式8（上水平），预测的样品取自预测样品A-M的加权平均。例如，样品a和d分别由模式4中（I/4+M/2+A/4）和（B/4+C/2+D/4）预测，也可由模式8中（I/2 + J/2 )和（J/4 + K/2 + L/4）。每块选择最佳的预测模式，是尽量少的编码块和其预测间的残余1，3，4

9、。2004年7月， Hx264视频编码标准添加了一个新的配置文件，称为保真度范围扩展（FRExt 修订1），这表明对于MPEG编码效率进一步提高，对于一些关键应用甚至高达3:110。FRExt修订中，为了提高编码效率，通过拓展4X4帧内预测的概念引入了一个额外的中间预测8x8空间亮度预测块。8X8的亮度帧内预测，9种预测模式的使用与4X4帧内预测是相同的。然而，依这个新的扩展配置文件的性能看，H.264编码器计算复杂度大大增加。2.2 16X16的亮度和色度帧内预测模式相对同质区的16X16亮度帧内预测模式选择，有四个预测模式的支持，如表二所列包括DC，纵向，横向和平面预测。这些模式中除了平面

10、预测外的指定都与4X4帧内预测相似。在垂直的预测上，每16列（16像素）当前宏块的预测只需1个过去解码的像素，和预测4列像素在4x4帧内预测中仅需一个解码的像素类似3,4,5,6。水平预测已解码的一个相邻像素预测一整行16像素，为这16行重复该过程。DC预测使用过去解码像素的行和列的平均来预测的16X16块的所有像素。平面预测使用水平和垂直相邻像素的加权组合。用于预测当前宏块的16X16的亮度分量的相邻像素属于相邻已解码的宏块。这个色度（色度）组件，应用4种预测模式到两个8X8色度块（U和V），这和16X16的亮度预测模式非常相似，如DC（模式0），水平（模式1），垂直（模式2）和平面（模式3

11、）。要充分利用这些模式，H.264编码器应选择采用率失真优化（RDO）的技术的最佳模式11。表 2 16X16帧内预测模式编号16X16帧内预测模式0垂直模式1水平模式2DC模式3平面模式H.264/AVC在编码MB时通过迭代每一个可能的色度帧内预测模式的亮度帧内决定来获得最佳的编码效率。因此，在MB中亮度和色度组成的模式组合数量是N8-chr*(N4*16+N8*4+N16)，N8-chr，N8，N4，和N16分别代表8X8模式的色度块，8X8，4X4和16X16亮度块的数量。这意味着，对于MB，它在确定最佳的RDO模式之前需执行4*（9*16+9*4+4）=736个不同的RDO计算 10，

12、14，15。因此，编码器的复杂性非常高。为了降低编码的复杂性和尽量小的RD性能下降，在下一节中提出的一个新的快速帧内模式决策方法。3、提出快速帧内模式决策H.264/AVC标准检查每个属于P帧以及I-帧块的所有可能的帧内预测模式，以达到最佳的编码效率。H.264用率失真优化（RDO）方法来决策模式，可以达到更高的压缩效率，但由于每个模式回合的变换和熵编码，它也带来了一个大的计算复杂度。为了降低这种复杂度，已经提出了几种快速帧内预测算法。在(Pan et al., 2003)14,15中，它基于本地的边缘信息，采用边缘方向预测可能的模式。在(Jongho Kim* and Jechang Jeo

13、ng, 2005)17中，以定向面具和相邻块的信息来选择可能的模式。在(Jun Sung Park, and Hyo Jung Song, 2006) 16中，基于一个较大的块预测方向和较小块类似的想法，使快速模式决策的影响降低。因此，作为一种替代方法，我们提出了一个基于相邻的预测模式和一个较小的块方向与较大块相类似堡垒相关的新的快速帧内模式决策方法。3.1 4X4亮度块帧内模式决定不是为每个亮度4X4块执行9个RDO，该算法只选择候选模式的一半。对于每个块来说，预测模式与两个相邻块的相关。从这个来观察，我们从水平模式（模式1），垂直模式（模式0），下右对角线（模式4）和下左对角线（模式3）获

14、得一个4X4块RDO模式预测的定向信息。这通过两种模式最低成本的位置，选择最有可能的帧内预测模式来设置候选人，概括为以下规则：1）如果垂直模式（模式0）是最低的成本，下右对角线模式（模式4）的次之，4X4块候选模式是垂直模式（模式0）和左垂直模式（模式7）。反之，如果下右对角线模式（模式4）是最低的成本，垂直模式（模式0）次之，4X4块候选模式为下右对角线模式（模式4）和下水平模式（模式6）。2）如果下右对角线模式（模式4）是最低的成本，水平模式（模式1）次之，4X4块的候选模式是下右对角线模式（模式4）和垂直靠右模式（模式5）。反之，如果水平模式（模式1）是最低的成本，下右对角线模式（模式4

15、）次之，4X4块的候选模式是水平模式（模式1）和上水平模式（模式8）。3）如果垂直模式（模式0）是最低的成本，模式下左对角线（模式3）次之，4X4块的候选模式是垂直模式（模式0）和右垂直模式（模式5）。反之，如果下左对角线模式（模式3）是最低的成本，垂直模式（模式0）次之，4X4块的候选模式是下左对角线模式（模式3）和左垂直模式（模式7）。4）如果下左对角线模式（模式3）是最低的成本，水平模式（模式1）次之，4X4块的候选模式是下左对角线模式（模式3）和左垂直模式（模式7）。反之，如果水平模式（模式1）是最低的成本，下左对角线模式（模式3）次之，4X4块的候选模式是水平模式（模式1）和下水平模

16、式（模式6）。5）如果一个模式的水平模式（模式1）是最低的成本，垂直模式（模式0）次之，4X4块的候选模式是水平模式（模式1）和上水平模式（模式8）。反之，如果垂直模式（模式0）是最低的成本，水平模式（模式1）次之，4X4块的候选模式是垂直模式（模式0）和左垂直模式（模式7）。6）其他块的候选模式是模式2（DC）和最低的成本模式。我们可以根据上述标准，确定候选群体，如表3所示。表 3 4X4帧内预测候选模式最低成本模式次之成本模式候选模式模式0模式4模式0,7模式4模式0模式4,6模式0模式3模式0,5模式3模式0模式3,7模式1模式4模式1,8模式4模式1模式4,5模式3模式1模式3,7模式

17、1模式3模式1,6模式0模式1模式0,7模式1模式0模式1,83.2 8X8亮度块的内部模式决策FRExt修订倡议是出于较高的高保真视频素材编码需求的迅速增长，特别是在应用领域，如专业的电影制作，视频后期制作，或高清晰度TV/DVD。在这项修正案中，通过扩展4X4帧内预测的概念引入了用于空间亮度预测的中间预测8X8块，但预测块大小是8X8而不是4X4，且低通过滤的预测来提高预测性能。8X8帧内模式的RD优化过程是相当复杂的。为了解决这个问题，我们可以通过削减的候选数来减少了计算的复杂度以达最佳的帧内预测模式。在我们的实验中，我们观察到，一个较小块的主导方向是类似于较大块的。如图2， 4X4亮度

18、块最好的预测模式，在8X8块中与8X8亮度块有相同方向。从这些观察看，每个8X8亮度块，和4个4X4亮度块建造这些8X8亮度块是8X8亮度帧内预测模式的候选模式。因此，每个8X8亮度块的候选模式的数量可以从9个减少到1-4个。算法的描述如下，并在图3说明：图 2 采用的4x4帧内预测模式结果图图 3 拟议的8x8帧内预测模式决策方法的流程图步骤1：每个8X8亮度块，获得建造这个块的每个4X4亮度块的模式，这些模式是这个8X8亮度块的候选模式。步骤2：演算已经在步骤1中选择的模式的RD成本，进行下一个候选的帧内预测模式。步骤3：如果所有候选的帧内预测模式结束，进行第4步。否则，如果候选的帧

19、内预测模式与已经计算的是相同的，进行下一个候选的帧内预测模式，并进行第2步，否则，进行步骤2。步骤4：以最小的成本决定最好的8X8亮度块帧内模式。3.3 16X16的亮度宏块帧内模式决策在H.264/AVC标准的视频编码中，相对同质的区域选择的16X16亮度帧内预测模式。因此，16X16的亮度宏块，不同于4X4亮度块，它只有4方向模式，如横向，垂直，DC和平面模式。所以，对于快速帧内预测模式决策，我们已在8X8亮度块的模式使这个宏块的基础上实施快速16X16的帧内模式预测算法。该算法是由两个步骤组成。步骤1：每个16X16的亮度宏块，获得每个建造此宏块的8X8亮度块的模式。步骤2：在这种情况

20、下，步骤1中已选择的8X8亮度块的模式，最可能的16X16帧内预测模式候选设置的结果总结在表4。表 4 依8X8模式得到的16X16候选模式8X8模式16X16候选模式模式7,0,5,2模式0（垂直）模式8,1,6,2模式1（水平）模式0,1,3,4,2模式2（DC）模式0,1,3,2模式3（平面）3.4 8x8的色度帧内预测模式H.264的色度帧内预测模式分为四种：DC，水平，垂直和平面模式。这些模式与帧内16x16宏块的亮度分量相同。因此，亮度和色度分量的统计特性有很大的不同。色度像素值的变化是比亮度的少得多。根据光源的方向和物体表面之间的角度，亮度的像素值逐步改变。另一方面，在一定区域内

21、的色度像素值变化很小18。色度的特征的使用和保证质量更好下减少主题的复杂性，我们使用色度帧内预测只有DC模式。3.5 计算复杂度的分析表5总结以所提出的方法计算RDO需要的候选数量。由表5可见，快速模式决策算法的编码器在不使用8X8帧内预测模式下需要执行只有1*（5*16+1）=81。假使H.264/AVC FRExt使用8X8亮度块，在我们计算中模式组合的复杂度减少到1 *（5*16+1*4+1）=85。因此，我们的算法的计算数量对于当前H.264 /AVCFRExt视频编码计算模式(J. S. Park and H. J. Song 2006)，(F. Pan, X. Lin,.2005)

22、和H.264全搜索法的1*（4* 16+4*9+4）=104，2*（4*16+9*4+2）=440和4*（9*16+9*4+4）=736，有了显著地提高。表 5 比较候选模式数量4、实验结果为了评估该方法的性能，我们提出的方法投入到H.264/AVC参考软件JM10.1中实施 19，和进行各种量化参数QP测试。该系统平台是英特尔奔腾4处理器，512MBDDR内存，1.8GHz的速度，Microsoft Windows XP系统。测试条件如下：（1）MV的搜索范围是16像素的QCIF，CIF；（2）启用RD优化；（3）参照系数等于5；（4）CABAC启用；（5）GOP结构仅是IPPPP或I-帧（

23、6）这个序列帧数是100。平均PSNR（PSNR），平均数据位（Bit），平均编码时间（Time）的变化方面，分别与穷举搜索的情况下进行比较。为了评估快速帧内模式决策算法省时性，定义以下计算来发现的时间差异。让TJM表示JM10.1编码器和TFI表示快速帧内模式决策算法用于编码的时间，被定义为（1）：表6显示的是提出的算法IPPP类型的不同序列在JM10.1的模拟结果。选取10，14，18，.42，46 为量化参数集。我们还可以看到仅I帧类型的序列模拟结果表7。可以看出，该算法在PSNR和比特率增量小损失下达到非常高的编码节省时间（约76）。表 6 IPPP序列模拟结果表 7 仅I帧序列的模拟

24、结果表 8 生成物对QCIF测试序列“流动”表 9 生成物对QCIF测试序列“推销员”表8和表9显示我们提出方法和全面搜索的方法，对下面描述不同的图像序列的性能比较。注意表中，正值意味着增量和负值意味着减少。实验结果表明，该方法在计算上有71.51到78.25减少，在比特率增加在1.94到4.63，并与全搜索法相类似的PSNR。图 4 比较序列News的PSNR-Y和比特率图 5 比较序列News的PSNR-UV和比特率图 6 News序列的计算时间比较图4,5,6显示了两个序列“新闻”的RD性能和计算时间。从这些数字可以看出，一个全搜索法一个我们提出的计算得到的两个RD曲线，几乎是相互重叠的

25、。这意味着，我们提出的算法在性能上与原来全搜索算法几乎是相同的。从图6，我们可以观察到，在相同的实验条件下快速帧内模式决定的编码时间明显比全搜索算法少。5、结论在本文中，我们提出的H.264视频编码的快速帧内预测模式决策方法，是基于方向信息和观测有一个较小块的主导方向和较大块类似。在我们的方法，在RDO计算MB的亮度和色度块的模式组合的数量显着减少，从736降低到81。从实验结果，我们可以看到，该方法可以在保持类似的比特率和PSNR下实现的计算复杂度的大大减少。参考文献1 ITU-T Recommendation H.264 and ISO/IEC 14496-10 (MPEG-4) AVC,

26、 “Advanced Video Coding for Generic Audiovisual Services,” (version 1: 2003, version 2: 2004) version 3: 2005 2 C. Kim, H. Shih, C.-C. Jay Kuo,”Fast H.264 Intra-prediction mode selection using joint spatial and transform domain features” J. Vis. Commun. Image R. 17 (2006) 291310. 3 T Wiegand, G Sull

27、ivan, G Bjntegaard, and A Luthra, ”Overview of the H.264/AVC Video Coding Standard”, IEEE transactions on circuits and systems for video technology, vol. 13, pp. 560-576, July 2003 4 B. Erol, M. Gallant, G. Ct and F. Kossentini, ”The H.263+ Video Coding Standard: Complexity an d Performance”, IEEE D

28、ata Compression Conference, Snowbird, Utah, pp. 259-268, March 1998. 5 A Puri, X Chen, A Luthra, ”Video coding using the H.264/MPEG-4 AVC compression standard,” Signal Processing: Image Communication 19 (2004) 793-849. 6 Iain E. G. Richardson, ”H.264 and MPEG4 Video Compression: Video Coding for Nex

29、t Generation Multimedia”, John Wiley and Sons, 2003 7 “Report of the formal verification tests on AVC (ISO/IEC 14 496-10 -ITU-T Rec.H.264),”, MPEG2003/N6231, Dec. 2003. 8 ISO/IEC IS 13818, Information Technology-Generic coding of moving pictures and associated audio information, Part 2: Video. ISO/I

30、EC JTC1/SC29/WG11 (2004) 9 ITU-T and ISO/IEC JTC 1, ”Generic coding of moving pictures and associated audio information - Part 2: Video,” ITU-T Recommendation H.262 - ISO/IEC 13818-2 (MPEG-2), Nov. 1994 10 G. J. Sullivan, P. Topiwala, A. Luthra, ”The H.264/AVC advanced video coding standard: Overvie

31、w and introduction to the fidelity range extensions”, SPIE Conf. on applications of digital image processing XXVII, vol. 5558, pp. 53-74, Aug. 2004. 11 G. Sullivan and T. Wiegand, ”Rate Distortion Optimization for Video Compression,” IEEE Signal Processing Magazine, pp. 74-90, Nov 98 12 Z. Chen, P.

32、Zhou, and Y. He, ”Fast integer pel and fractional pel motion estimation for JVT,” presented at the 6th JVT Meeting (JVT-F017), Awaji Island, Japan, Dec. 2002. 13 X. Li and G. Wu, ”Fast integer pixel motion estimation,” presented at the 6th JVT Meeting (JVT-F011), Awaji Island, Japan, Dec. 2002 14 F.

33、 Pan, X. Lin, S. Rahardja, K.P. Lim, Z.G. Li, G.N. Feng, D.J. Wu, and S. Wu, ”Fast mode decision fo r intra prediction,” JVT-G013, 7th JVT Meeting, Pattaya, Thailand, Mar. 2003. 15 Feng Pan, Xiao Lin, Susanto Rahardja, Keng Pang Lim, Z. G. Li, Dajun Wu, Si Wu, ”Fast mode decision algorithm for intra

34、prediction in H.264/AVC video coding”, Circuits and Systems for Video Technology, IEEE Transactions on Volume 15, Issue 7, pp. 813-822, July 2005. 16J. S. Park, and H. J. Song, ”Selective Intra Prediction Mode Decision for H.264/AVC Encoders”, Transactions on Engineering, Computing and Technology Vo

35、lume 13 May 2006, pp.51-55.17 J. Kim, J. Jeong, ”Fast intra-mode decision in H.264 video coding using simple directional masks”, VCIP 2005, of proceedings of SPIE Vol. 5960, pp.1071-1079. 18 W. S. Kim, D. S. Kim and K. W. Kim, ”Complexity Reduction of Plane mode in Chroma Intra Prediction”, presented at the 5th JVT meetig(JVTE050), Geneva, CH, 9-17 October, 2002. 19 JM Reference Software Version 10.1 http:/iphome.hhi.de/suehring/tml/download/.文献翻译原文

展开阅读全文

毕业设计论文 外文文献翻译 H.264AVCControl Volume 中英文对照.doc

毕业设计论文外文文献翻译 H.264AVCControl Volume 中英文对照.doc