FPGA与H.264 AVC视频编码标准.ppt

资源描述

《FPGA与H.264 AVC视频编码标准.ppt》由会员分享，可在线阅读，更多相关《FPGA与H.264 AVC视频编码标准.ppt（4页珍藏版）》请在三一办公上搜索。

1、90,通信与计算机公司在FPGA上实现H.264/AVC视频编码标准,尽管承诺将比已有视频编码标准具有更高的编码效率，它仍为系统架构师、工程师和硬件设计人员带来了巨大的工程设计挑战。标准引入了自年推出之后视频编码标准演进过程中出现的大部分重,开发成本。复杂度分析为了实现实时标准清晰度（）或高清晰度（）分辩率编码解决方案，系统架构师常常需要使用多个和可编程。,码器的复杂度的典型情况。请注意，在表中，运动估计、宏块块处理（包括模式决策），以及运动补偿模块是基本候选硬件加速单元。然而，单凭计算复杂度并不能决定一个功能模块是否应映射为硬件或是使其保持为软件。为了评估,大改变和算法间断（,为了说明所需

2、计算的巨大复杂度，在由、可编程或通用主,）。实现编码标准所需的算法计算复杂度、数据局部性，以及算法和数据并行性，常常会直,先探讨一下编码器的典型运行时的周期要求。编码器基于由联合视频工作组（）提供的软件模型，该工作组由,处理器混合组成的平台上实现编码标准时，软件和硬件分割的可行性，需要分析将会影响整体设计决策的大量架构问题。,接影响系统级别的整体架构决策。来自的视频编码专家组,数据局部性。在同步设计中，,这种影响又会决定在广播、视频编辑、电话会议以及消费电子领域开发解决方案所需的最终,（）和的运动图像专家组（）的专家组成。采用的软件，在,按照特定的顺序和粒度访问内存，同时根据延迟、总线竞

3、争、对准、传输率以及所用内存的类型（如内存、和,表按文件排列的编码器复杂度情况,通用,等）使时钟周期数降至最小的能力,功能块,占运行时总周期数的百分比,、内存的平台上运行，按照主要配置编码解决方案实现，需要约，（每秒十亿次运算）。表显示了基于通用处理器架构的编,至关重要。数据局部性问题主要是由数据单元和算术单元（或处理引擎）之间的物理接口体现的。数据并行性。大多数信号处理算法都是对高度并行的数据进行操作（如滤波）。单指令多数据（）和向量处理器对可被并行化或做成向量格式（或长数据宽度）的数据具有较高的处理效率。可通过提供大量块支持大量极高总计带宽要求来实现这一点。在新的,2005.8 电子设

4、计应用,评估。,引擎。,二,放。,91,通信与计算机器件中，块的数量与的逻辑片数紧密匹配（例如，具有个块，个逻辑片；具有个块，个逻辑片；具有个块，个逻辑片）。信号处理算法并行机制。在典型的可编程或通用处理器中，信号处理算法并行机制通常是指指令级并行（）。超长指令字（）处理器是此类采用的机,器中的一个例子，它将多条指令（、及）组合起来，在一个周期内执行。处理器中高度,图包括功能块和数据流的宏块编码器,流水线化的执行单元也是实现并行机制的典型硬件示例。现在已经有可编程采用这种架构（如的）。但是，并非所有算法都能使用这种并行机制。递归算法，如滤波、中的变长编码（）、上下文自

5、适应变长编码（），以及中的上下文自适应二进制算术编码（），当映射到这些可编程时，均无法达到最优且效率不高。这是因为数据递归阻碍了的有效利用。作为取代方案，可在结构中有效地构建专用硬件计算复杂度。可编程受计,外，结构还可以具有多时钟域，从而允许选择性硬件模块根据各自的计算要求使用独立的时钟速度。理论上质量的最优性。当且仅当对复杂度没有限制时，任何基于速率失真曲线的理论最优解决方案均可实现。在可编程或通用处理器中，计算复杂度常受可用时钟周期的限制。而则相反，通过对硬件引擎的多重实例化，或提高结构中块和寄存器组的利用率，实行数据和算法并行机制，从而提供更高的灵活性。可编程或通用处理器通常受每个周期发

6、出的指令数、执行单元中的流水线级数以及完全馈给执,流的整个宏块级编码器。标准的主要优势在于能够通过以不同的方式和方向分析像素冗余，预测要编码的图像内容的值，而这种分析以前从未在其他标准中进行过。但与以前的标准相比，其复杂度和内存访问带宽增加了倍。改进预测方法下面重点分析一下在视频编码设计中实现其增强编码效率的主要特点，根据前文讨论过的设计准则对这些功能模块进行四分之一像素精度（）运动补偿。以前的标,算复杂度的限制，可通过处理器的,行单元所需最大数据宽度的限制。准采用二分之一像素运动向量精,时钟速率来度量。在中实现的信号处理算法通常为计算密集型算法。其中的例子有运动估计中的绝对差值和（）引擎

7、以及视频缩,在可编程中，受每个任务可用周期数的限制，视频质量常常大受影响。而在结构中，硬件资源则可得到完全分配（三步和完全,度。新设计通过采用四分之一像素运动向量精度对此进行了改善。分之一像素位置的预测值是通过沿横向和纵向采用一个一维抽头,通过将这些模块映射到,搜索运动估计对比）。,滤波器，计算得到的。,中，主处理器或可编程就可有额外的周期来处理其他算法。此,使用实现功能模块图为定义了主功能块和数据,四分之一像素位置的预测值是通过将全像素和二分之一像素位置,Electronic Design&Application World-Nikkei Electronics China,92,这,通

8、信与计算机分别访问。加权预测。认为在对一些有衰弱现象的视频图像进行编码时，采用加权运动补偿预测可以极大地改善编码效率。改善编码效率除了预测方法得到改进以外，该标准设计的其他部分也对编码效率的改善进行了增强。下面两个附加特性最容易对基于关于软件和硬件分割的设计准则的整体系统架构,图典型硬件软件功能块分割,产生影响。小块尺寸，层次化，精确匹配,的采样值进行平均得到的。这些二次采样内插运算可在内的硬件中高效地实现。小块尺寸可变块大小运动补偿。该标准在像素宏块尺寸中为铺瓦结构（）提供了更多的灵活性。它允许使用、和子宏块尺寸。由于给定宏块铺瓦结构的组合增多，因此要找到一个速率失真优化铺瓦解决方案需要很高

9、的计算强度。这一额外特性为运动估计、细化和模式决策过程中所用的计算引擎增加了巨大负荷。环中自适应去块（）滤波。去块滤波器已经在和第部分的实现中作为后处理滤波器被成功采用。在中，去块滤波器将在运动补偿环路中移动，对在预测和解码过程中的残留差值编码阶段造成的块边缘进行滤波。滤波对块和宏块边缘均可进行，两个边上的两个像素可能会被一个三抽头滤波器更新。滤波器系数或强度由内2005.8 电子设计应用,容自适应非线性滤波器决定。帧内编码有向空间预测。当无法采用运动估计时，可以采用帧内有向空间预测来估计空间冗余。种技术通过从相邻块沿预先定义的一组方向向相邻像素外插来预测当前块。然后就可以对预测块和实际块之间

10、的差值进行编码了。这种方法在存在空间冗余的平面背景中特别有用。对于预测，总共有九种预测方向；对于，则有种预测方向。注意，在情况下，由于数据因果性，将导致对当前块上边和左边相邻的个像素值的快速内存访问。对于，每边将使用个像素来预测一个块。多参考图像运动补偿。标准为帧间编码提供了多参考帧选项。除非参考图像的数量为，否则必须指定参考图像在多图像缓冲区内的索引位置。多图像缓冲区的尺寸决定编码器和解码器中内存的使用情况。这些参考帧缓冲区必须在编码器的运动估计和补偿阶段,反变换和短字长变换。同其他标准一样，也是对运动补偿预测残留施加变换编码。但是，与以前采用离散余弦变换（）的标准不同，这种变换是施加于块

11、上，并且采用位整数格式，可以精确地进行反变换。小块有助于减小分块和振铃结果，而精确整数规范则消除了编码器与反变换中的解码器之间的一切不匹配问题。此外，还采用了一种基于阿达玛矩阵（）的附加变换，以实现已变换块的个系数的冗余。与相比，所有整数变换矩阵中只包含从到之间的整数。这样，只使用低复杂度的移位寄存器和加法器就可以通过位算术计算变换和反变换。算术和上下文自适应熵编码。有两种熵编码方法：一种是基于上下文自适应切换变长编码集（）的低复杂度技术，一种是计算要求更高的基于上下文的自适应二进制算术编码（）算法。是的基本,结语,。,美元。,”,支,94,通信与计算机,熵编码方法。其基本编码工具包括一个结构

12、化编码，它通过单独定制的映射，可应用于除与量化变换系数有关的语法元素以外的所有语法元素。则采用了一种更为复杂的编码方案。首先，根据一种预定义的扫描模式，将变换系数映射到一个维数组。量化后，块将只包含一些重要的非零系数。根据该统计结果，使用个数据元素来传递特征块的量化变换系数的信息。使用可进一步改善熵编码的效率。中的两个部分。规定算术编码内核引擎及其相关的概率估计是免乘法、低复杂度方法，只能使用移位和查找表。自适应编码,的使用使之能够与非静止符号统计适应。通过采用根据前面编码语法元素进行估计从而在条件概率模型间切换的上下文建模方法，可获得比低的位速率。图显示了视频编解码器系统级功能块的典型分割

13、。该解决方案基于针对公司的的评估模块，结合或子插件板实现。以最优模式使用时，与以前的视频编码标准（如第部,分和）相比，标准的编码工具可在很宽的位速率和分辩率范围内使编码效率提高约。但是，当分辩率比源输入格式（）高时，算法极为复杂。参考文献“联合视频规范国际标准建议草案和最终草案（），”与联合视频工作组（），、和，年月。“有关视频编码标准的专门问题”电路系统视频技术（）：,Silicon Laboratories的FM调谐器增强便携式设备功能,目前，收听无线电广播已不,系列。完全采用技术,在该系列调谐器当中，,再只是通过传统的收音机来实现，提供从天线输入到音频输出的完整,集成了选择

14、性滤波、自动,越来越多的便携式设备，如手机、等都具备了该功能，因此，调谐器日益成为这些便携式设备的重要组成部分。据统计，年全球调谐器市场总量将达到亿个，而亚洲会占到其中的，特别是中国、日本和韩国，预计会有三位数的增长。由于便携式设备要求小尺寸和低功耗，调谐器要想发挥最优性能，设计工程师就必须在成本、大小和易用性方面重点考虑，在这些方面具有比较强的优势，它是公司推出的广播无线电调谐器,方案。通过使用数字结构，该调谐器在提高性能的同时减少了大量的元件数目，使其非常适用于蜂窝手机、独立式电台、播放器、接收器和各种便携式音频设备。副总裁表示：“调谐器系列使客户以轻松并且经济的方式将电台作为标准功能添加到任何应用中。采用了的嵌入处理技术以及手机收发器中应用的低数字结构，该数字结构提供了高水准的选择性和灵敏度性能，从而减少了,增益控制、频率合成器和音频处理。传统的解决方案需要多个元件，而只需要一个外部电源旁路电容器并且只需占用不到的电路板空间。此外，还提供支持欧洲无线电数据系统（）和美国无线电广播数据系统（）的，能够将诸如电台和歌曲名称的数据显示给用户。将在今年第季度实现量产。每片美元。持的每片美元。评估板目前的价格为,干扰并提高了接收能力。2005.8 电子设计应用,

展开阅读全文