晚间超市摄像布防与报警系统的设计与实现.doc

资源描述

《晚间超市摄像布防与报警系统的设计与实现.doc》由会员分享，可在线阅读，更多相关《晚间超市摄像布防与报警系统的设计与实现.doc（67页珍藏版）》请在三一办公上搜索。

1、晚间超市摄像布防与报警系统的设计与实现摘要超市运营过程中的安全隐患、安全漏洞常常给连锁店的经营带来不可预见的损失，这就需要实现本地、实时、全方位的监控达到店内工作人员统一监管店面情况，同时需要实时的图像记录.以备日后查询。网络视频监控系统.可以在远程进行实时监控.根据超市的环境与实际场景的情况.选择安装合适数量的监控点合理的布局整体规划.在运行正常的情况下，可以确保每个角落每个物品每个人员实时全天候不间断监控在超市的管理之下。本文在现有硬件系统的基础上研究多媒体数字视频监控的实现方案，并在此基础上设计开发超市视频监控的软件系统，最后完成系统的产品化。关键词：视频监控，超市安全，设计与实现AB

2、STRACTSupermarket operators in the process of security risk, security vulnerabilities are often brought to the chain of unforeseen operating losses, which need to achieve local, real-time, comprehensive monitoring of the shop staff to achieve a unified regulatory stores, while the need for real-time

3、 image recording For future inquiries. Network Video Monitoring System Can real-time remote monitoring According to the supermarket scene and the actual environmental situation .Select install the appropriate number of monitoring points, the overall planning and rational distribution. In the case of

4、 normal operation to ensure that every item in every corner each staff around the clock real-time continuous monitoring of the management in the supermarket. In this thesis, the existing hardware system based on multi-media monitoring of the realization of digital video programs on the basis of desi

5、gn and development software stores video surveillance systems, the final completion of the production system. Key words: video surveillance, supermarkets safety, design and implementation 目录第一章引言11.1 选题背景与意义11.2 国内外研究现状11.3 研究思路及方法61.4 主要内容和结构6第二章数字监控报警系统的关键技术82.1 视频压缩编码技术82.2 网络实时传输技术152.3 流媒体技术

6、152.4 网络虚拟矩阵202.5运动目标检测212.5.1运动目标检测综述212.5.2运动目标检测算法的分类232.5.3目标特征提取262.5.4运动目标跟踪27第三章超市摄像布防报警系统的整体设计313.1 开发平台的选择313.2 开发工具的选择313.3 网络架构的选择333.4 数据传送模式的选择363.5 数据编码格式的选择373.6 智能识别的策略383.7 系统流程图39第四章超市摄像布防报警系统的具体实现404.1 系统总体结构404.2 系统模块划分444.3 关键模块的实现454.3.1 用户登录模块454.3.2 图像控制模块474.3.3 数据处理模块484.

7、3.4 系统设置模块53第五章结论及展望555.1 结论555.2 展望55致谢57参考文献58第一章引言1.1 选题背景与意义连锁超市运营过程中的安全隐患、安全漏洞常常给连锁店的经营带来不可预见的损失，比如店内物品的失窃、店内人员的安全、不法分子的干扰、店面环境的影响等.这就需要实现本地、实时、全方位的监控达到店内工作人员统一监管店面情况，同时需要实时的图像记录.以备日后查询。网络视频监控系统.可以在远程进行实时监控.根据超市的环境与实际场景的情况.选择安装合适数量的监控点合理的布局整体规划.在运行正常的情况下，可以确保每个角落每个物品每个人员实时全天候不间断监控在超市的管理之下。该系统

8、可以在无人看守情景下.实时远程录像，对事实的发生经过作备份处理对事后取证作为第一手资料及证据，在对个别人员监控的同时不会打扰其他顾客.从而达到现代超市高级管理的要求。近几年来，视频监控系统的相关技术有了很大的发展。系统各组成部分前端视频采集、视频传输、视频记录、控制、显示部分技术发展很快。为了和电脑对应，传统的模拟设备已经开始向数字设备转换；数字资料已经开始方便地传送和管理；可以网络设备连接其他的数字产品来扩大应用范围；远程传送的需求也越来越大，这表明视频监控技术已全面进入数字时代。网络信息的发展、许多大型超市已经具备局域网和广域网、有许多要求是在PC控制下的升级系统、图象处理用PC有许多的弹

9、性、多种的数据保存硬件发展很快、基础设施的发展等都为视频监控技术的发展创造了条件。视频监控技术发展经历了模拟监控、数字监控正在向大规模网络监控发展。利用模拟与数字相结合的技术实现超市视频监控系统的建设，能够达到超市治安人防与技防相结合，改善超市运营环境安全的目的。1.2 国内外研究现状随着对视频监控系统要求的提高以及视频监控应用在诸多领域的普及，视频监控技术也有了飞速发展，不仅实现了远距离监控，还实现了视频联网监控。视频联网监控是原距离大范围监控发展到一定阶段的产物，视频联网监控使人们对远距离大范围监控以及视频资源共享的迫切需求得到了满足。国内发展趋势主要是网络数字视频监控为主流方向，模拟视频

10、监控逐渐被数字化系统所取代。1 视频监控系统的发展阶段1）模拟监控系统 20世纪90年代前，主要是以模拟设备为主的闭路电视监控系统，称为第一代。当时的视频监控技术比较简单，都是直接采用视频同轴电缆将视频图像从前端监控点传回监控中心，并逐一显示在监视器上。 2）数字化本地视频监控系统 20世纪90年代中期，随着计算机处理能力的提高和视频技术的发展，人们利用计算机的高速数据处理能力进行视频的采集和处理，利用显示器的高分辨率实现图像的多画面显示，从而大大提高了图像质量。这种基于PC机的多媒体主控台系统称为第二代数字化本地视频监控系统. 3）远程视频监控系统20世纪90年代末，随着网络带宽、计算机处理

11、能力和存储容量的快速提高，以及各种实用视频处理技术的出现，视频监控步入了全数字化的网络时代，称为第三代远程视频监控系统。第三代视频监控系统以网络为依托，以数字视频的压缩、传输、存储和播放为核心，以智能实用的图像分析为特色，引发了视频监控行业的技术革命，受到了学术界、产业界和使用部门的高度重视。4）存在的问题根据调研结果显示，目前国内绝大部分超市都对报警系统有所迫切需求。但一部分超市只具有简单报警功能的安防设备；而对于大型的综合超市，由于其对安防的要求较高，对报警系统业提出了更高的要求。传统的报警系统产品多采用警铃或电话等传统报警方式，即当警报发生时，通过响铃或拨打报警电话进行报警。这类传统的报

12、警系统具有成本低廉、结构简单、安全可靠的特点。但是，由于在报警时无法将精准的现场视频信息及时传递到接警终端，导致直观性较差、虚警率较高。同时这类系统多采用有线连接方式，安装、配置比较困难。这些都大大限制了报警系统的市场应用与普及推广。根据我国超市建设的实际情况，为满足新时期超市的要求，并充分考虑其经济性和可靠性，能真正实现智能化报警的要求来确定的。总结以上，系统的功能需求如下：1.系统应具有较强的多任务能力，能够接收报警信息，捕获视频图片，各个任务要相互协调，保证系统的高效、稳定运行。2.系统应具有非常高的可靠性，必须确保系统尽可能不出错，即使出错也有办法迅速恢复。3.当用户需要现场图片时，系

13、统可获取实时报警图片。4. 系统应具有一定的实时性。特别是在接收报警信息、捕获报警现场图片时，系统应具备较高的实时性。5.系统应具备良好的适应性和可扩展性。报警系统应用领域广泛，为了灵活地适应不同的工作环境，系统必须具备良好适用性，系统应能根据用户需求灵活地对报警传感器进行选择。根据系统拟达到的总体功能，将其划分为以下功能模块：前端警情采集模块、前端警情控制模块、无线收发模块、核心控制模块等。2.视频监控技术发展现状当今社会是一个信息高速发展的时代，获取信息的方便和快捷可以使我们在信息化的今天领先一步创造出巨大的利益，而我们获取信息的一个重要的途径就是通过眼睛。在人类感官接受的各种信息中约有8

14、0%来自视觉。图像是对客观事物形象、生动的描述，是直观而具体的信息表达形式，是人类最重要的信息载体。随着科学技术的快速发展和人民物质生活水平的提高，视频监控系统以其直观、方便和信息内容丰富等特点，日益受到人们的青睐，并在各行各业得到了广泛的应用。生活中有小区安全监控，电讯行业有基站监控，银行系统有柜员机监控，林业部门有火情监控，交通方面有违章和流量监控等等。自从摄像机、电视机等出现后，最初的模拟视频监控系统也随之出现了。经过较长时间的发展并在实际工程中得到了非常广泛的应用，发展已经非常成熟，性能也十分稳定，但由于系统中以模拟图象信息为主，对图象的处理和传送均采用模拟技术，不仅图象质量低，而且系

15、统资源浪费严重，不易组成复杂的网络结构，主要是一种单功能、单向、集总方式的信息采集网络，监控功能可扩展性差。因此系统尽管已发展到很高的水平，已无太多潜力可挖，其局限性依然存在。随着计算机的普及应用，网络通信技术及图像压缩处理技术的快速发展，在视频监控领域中，数字化和网络化成为一种趋势。上世纪末，基于PC的数字化网络视频监控系统迅速崛起，部分地取代了以视频矩阵图像分割器、录像机为核心，辅以其它设备的模拟视频监控系统。数字化的视频通信在图像质量、传输距离、抗干扰能力等方面都要优越于传统的模拟视频通信，并且数字图像处理更加方便。因此，数字化网络视频监控系统将必然取代传统的模拟监控系统。但随着基于Pc

16、的视频监控系统的发展，在实际工程使用过程中，也暴露出一些不足，主要是系统工作的实时性不高、稳定性较差，而且成本较高;PC需要专人管理，操作较为烦琐;兼容性差，采用专用的视频压缩卡对数据进行处理，因此系统一般只支持一种编解码格式，无法提供对其他编码方式的支持。随着国际经济的发展，各国对安防日益重视，视频监控终于在21世纪迎来全球目光的关注。世界各国工业经济、旅游经济、文化体育事业的互融促使视频监控技术的应用领域越来越多元化，而网络视频监控这一高新技术的突破也大力推动全球的繁荣与稳定。世界各国在发展视频监控业务方面有着不同的业务模式。目前国外视频监控业务主要应用在公共领域、行业用户和个人用户。在公

17、共场所，国外设置了众多监控设备，以加强对公共领域安全的控制能力。另外，在交通、银行、大型连锁超市、居民住宅等领域都己经得到了广泛应用。在美、英等国，个人使用视频监控主要是应用于住宅的安全防范和财产的监控。同时，国外正在悄悄地推进视频监控技术的全新意义的革新，那就是只能视频监控技术(Intelligent Video Surveillance)。智能视频监控技术是计算机视觉和模式识别技术在视频监控领域的应用。国外智能视频监控技术的发展动力是源于对特殊监控市场的需求，特别是出于反恐、国家安全、社会安定等多方面的需要。智能视频监控技术与预警技术逐渐成为国际上最被关注的前沿研究领域。3视频监控的发展趋

18、势视频监控在国内经历了这么多的发展，形成了成熟、稳定的应用模式。虽然数字视频监控系统实现了视频监控手段的数字化、网络化和集成化。但是随着用户的需求不断的在发生变化。从目前来看，视频监控有以下几项方面推动着视频监控的发展。 1)智能化当前的大多数的视频监控系统存在一个很重要的缺陷:对视频监控内容只能靠人来判断。众所周知，视频监控工作劳动强度很大，它对工作人员的注意力、警惕性，特别对异常的反应能力要求很高，一般监控过程中发生的失物都是由注意力不集中造成的。而且多用于“事后处理”即调查取证，并没有充分发挥视频监控系统的主动性.智能化的视频监控系统，是网络化视频监控领域的最前沿的应用模式之一。它以数

19、字视频监控系统为基础，借助于计算机的强大的数据处理功能，对视频画面中的海量数据进行分析，过滤用户不关心的信息，仅仅为监控者提供有用的关键信息。现在的计算机技术、数字信息处理技术和图像技术的结合使得图像自动检测、识别、跟踪和视频信号分析成为现实，尤其是计算机视觉相关算法和技术的综合应用，使视频监控智能化成为可能。未来的视频监控系统将不仅仅局限于被动地提供视频画面，更要求系统本身有足够的智能，能够识别不同的物体，发现监控画面中的异常情况，以最快和最佳的方式发出警报和提供有用信息，从而更加有效地协助安全人员处理危机，并最大限度地降低误报和漏报现象，成为应对袭击和处理突发事件的有力辅助工具。 2)视

20、频监控平台化使用视频监控的用户群经历了一个变化的过程。起初，视频监控仅仅被用在一些专业很强的行业中，如金融行业，而且监控信息相对独立。使用视频监控的行业慢慢增多，由于行业之间存在着诸多联系，比如金融系统和公安系统相结合、城市中的各行各业的视频监控被融合在一起等。再后来，视频监控的需求开始进入人们的实际生活中，如平安城市、小区监控、室内监控、智能楼宇等等。使用视频监控的领域越来越广，而各种领域之间又存在着必然的联系。视频监控平台基于网络接入业务，不仅仅能够远程图像监控、远程图像存储、远程图像管理。要更进一步实现把独立图像采集点进行联网，实现跨区域统一监控、统一存储、统一管理、资源共享，整合利

21、用行业视频资源，达到视频资源的最大程度的共享。3)与信息系统联动资源整合的同时，要求视频监控与其他信息系统实现联动。比如水利行业的信息系统要与交通部门的信息系统联动，共享两个系统中的视频资源，能达到迅速、方便、准确的处理事件的目的。1.3 研究思路及方法（1）文献法搜集、鉴别、整理文献，并通过对文献的研究形成对事实的科学认识。通过收集和查阅了有关就业的统计资料、学术专著和学术期刊，检索到有关视频监控平台的相关系统的研究与开发，为本课题研究获得可观、可靠的信息和资料。比较和借鉴，通过检索、收集、鉴别以及研究与运用这一系统化过程，分析其他类似系统的优点，从而找出事物间的联系、规律，为本研究取得借

22、鉴。(2)案例法所谓案例，一般是指对某种事物的实际情况所做出的客观描述。案例法是将其他现成的成功系统作为研究对象，以此作为资料积累进行研究的一种方法，案例研究的主体是对已有系统的准确分析。对于本研究来说，个案研究有特殊的意义。个案研究的对象较易选择，可结合工作中遇到的其他系统展开研究。案例研究具有显著的实践价值，也容易取得效果。通过案例研究，可以由点及面，了解技术发展动态，有利于完成全面的研究工作。本文拟采用的方法：防报警系统摄像系统的整体框架设计；基于运动目标的夜间图像信息采集；基于智能编码的信息识别系统；1.4 主要内容和结构本课题的主要内容主要是在现有硬件系统的基础上研究多媒体数字视频

23、监控的实现方案，并在此基础上设计开发超市视频监控的软件系统，最后完成系统的产品化。本文的研究内容具体包括以下几个方面:1）对视频监控开发平台的研究，研究软件体系结构，尤其对多层软件架构的理解和设计，以及框架设计和设计模式的学习和研究。2）对开发平台的设计的总体设计与到具体的实现细节，涉及到的相关知识的学习与理解。3）视频监控开发平台的统一性是本文最大的特点，统一了接口、统一了通讯协议，最终提供了稳定的功能，达到视频监控系统的强大兼容性。第二章数字监控报警系统的关键技术2.1 视频压缩编码技术压缩编码的目的就是要以尽量少的比特数表征图像，同时保持复原图像的质量，使它符合特定应用场合的要求

24、。多媒体数据的压缩主要是指对视频数据和音频数据的压缩，两者所使用的基本技术是相同的。但视频信号的数据量比音频的大的多，压缩起来也更困难。视频图像数据有大量的冗余信息（也就是说有极强的相关性）。其中冗余信息可分为空域冗余信息和时域冗余信息。压缩技术就是将数据中的冗余信息去掉（去除数据之间的相关性），压缩技术包含帧内图像数据压缩技术、帧间图像数据压缩技术和熵编码压缩技术。使用帧间编码技术和熵编码技术可去除空域冗余信息。帧内图像和预测差分信号都有很高的空域冗余信息。使用变换编码可将空域信号变换到另一正交矢量空间，使其相关性下降，数据冗余度减小。经过变换编码后，产生一批变换系数，对这些系数进行量化编码

25、，使编码器的输出达到一定的位率。这一过程导致精度的降低。熵编码是无损编码，它对变换、量化后得到的系数和运动信息，进行进一步的压缩。图像编码主要分为静态图像编码和动态图像编码两种。其中静态图像编码主要有 JPEG 和 JPEG2000 两种标准，他们都是由国际标准组织(ISO)下从事静态影像压缩标准制定的委员会联合图片专家组(Joint Photographic Experts Group)制订的。JPEG 是基于二维 DCT 变换的，而 JPEG20DO 是基于二维离散小波变换的，用于视频监控的 MJPEG（Motion JPEG）压缩技术，主要是基于此发展起来的。动态图像压缩标准主要由两个系

26、列组成：一个是 ISO/IEC 的活动图像专家组(Moving Picture Expert Group)制订的 MPEG 系列标准，其中有 MPEG-1、MPEG-2、MPEG-4 等；再一个就是 ITU 的 VCEG（视频编码专家组）制订的的 H 系列标准，如 H.261、H.263、H.26L 等。MPEG-4part10/H.264 是 ITU-T 的 VCEG 和 ISO/IEC的 MPEG 组成的联合视频组(JVT joint video team)开发的一个新的数字视频编码标准，它既是 ITU-T 的 H.264,又是 ISO/IEC 的 MPEG-4 的第 10 部分。视频监控

27、系统的一个重要的特征就是实时性，而且在保证实时性的基础上尽量减少对系统资源的耗费，这就需要提高系统的运行效率。在视频监控系统中最耗费资源的部分就是视频编解码，其中又以视频编码为最。现在在网络数字视频监控系统中使用的比较多的是 H.263，MPEG-4。H.263 是比较老的视频标准，一些编码效率上不及 MPEG-4，现在 MPEG-4 已得到越来越广泛的应用，不仅仅在数字监控中，在流媒体、IPTV 及移动通信领域也得到青睐。鉴于 H.264 的复杂性，它的应用受到一定限制，但由于它的编码效率明显高子以往的标准，人们都很看好它的未来。下面分别介绍一下这几种标准，其中着重介绍一下MPEG-4par

28、t10/H.246 标准。目前监控中主要采用 MJPEG、MPEG1/2、MPEG4(SP/ASP)、H.264/AVC 等几种视频编码技术。对于最终用户来言他最为关心的主要有：清晰度、存储量（带宽）、稳定性还有价格。采用不同的压缩技术，将很大程度影响以上几大要素。MPEG-2有三种图像编码：帧内编码图象、前向预测编码图象、双向预测编码图象。帧内编码图象简称“I帧”，I帧是只使用本帧内的数据进行编码的图象。即只对本帧内的图象象块进行DCT变换、量化和熵编码等压缩处理。在一个图象组（GOP）中的第一个编码帧应为I帧；前向预测编码图象简称“P帧”，P帧是根据前面最靠近的I帧或P帧作为参考帧进行前向

29、预测编码的图象。由于P帧使用了运动补偿压缩方法，压缩比高于I帧，双向预测编码图象简称“B帧”。B帧是根据一个过去的参考帧和一个将来的参考帧进行双向预测的编码图象。其参考帧可以是一个I帧和P帧，或是前后两个P帧。由于B帧是在两个参考帧基础上双向预测得出的，它的预测精度能做到很高，其压缩比较大。有了I、P、B帧的组合，可以既得到较高的综合码率压缩比，又保证图象质量。当P帧的宏块进入编码器时，前面的I帧已经存储在I帧存储器中作为参考帧。运动估计器ME（ Motion Estimation）在I帧中搜索与P帧输入宏块最佳的匹配宏块。在I帧搜索到的最匹配宏块相对于P帧宏块的位置就是运动矢量MV（Moti

30、on Vector）。运动矢量分为两路输出，一路送到熵编码器中进行编码，另一路送入运动检测器中，同时I帧图象也输入到MC中。根据运动矢量坐标以及P帧宏块的位置找到I帧中的匹配宏块。该宏块由运动检测器输出向上分为两路，一路进入减法器与P帧宏块相减得预测误差。当B帧的宏块进入编码器时，参考帧I、P帧或P、P帧已经储存在I帧和P帧存储器内作为参考帧。运动估计器，进行双向运动预测。找到两个运动矢量后，分两路输出，一路送到熵编码器，另一路送到运动补偿预测器，同时I帧和P帧也一起输到此预测器。由B帧宏块位置和两个运动矢量MV1、MV2，可以分别找到I帧的匹配宏块和P帧的匹配宏块，将它们按比例相加后，由预测

31、器输出，作为帧间预测值。然后进入减法器与B帧宏块相减得预测误差。预测误差经过DCT和量化器后，直接进入熵编码器，由于B帧不作为基准帧。除各种基于国际标准的编码技术外，还有许多新技术的发展十分引人注目：1 基于协议的视频压缩编码技术国际电信联盟（ITU-T）已经制定的视频编码标准包括H.261（1990年）、H.263（1995年）、H.263+（1998年），2000年 11月份将通过H.263+的最终文本。H.26X系列标准是专门用于低比特率视频通信的视频编码标准，具有较高的压缩比，因此特别适合于无线视频传输的需要。它们采用的基本技术包括：DCT变换、运动补偿、量化、熵编码等。H.263+和

32、H.263+中更增加考虑了较为恶劣的无线环境，设计了多种增强码流鲁棒性的方法，定义了分线编码的语法规则。在视频压缩中有损（Lossy ）和无损（Lossless）的概念与静态图像中基本类似。无损压缩也即压缩前和解压缩后的数据完全一致。多数的无损压缩都采用RLE行程编码算法。有损压缩意味着解压缩后的数据与压缩前的数据不一致。在压缩的过程中要丢失一些人眼和人耳所不敏感的图像或音频信息，而且丢失的信息不可恢复。几乎所有高压缩的算法都采用有损压缩，这样才能达到低数据率的目标。丢失的数据率与压缩比有关，压缩比越小，丢失的数据越多，解压缩后的效果一般越差。此外，某些有损压缩算法采用多次重复压缩的方式，这样

33、还会引起额外的数据丢失。帧内（Intraframe）压缩也称为空间压缩（Spatial compression）。当压缩一帧图像时，仅考虑本帧的数据而不考虑相邻帧之间的冗余信息，这实际上与静态图像压缩类似。帧内一般采用有损压缩算法，由于帧内压缩时各个帧之间没有相互关系，所以压缩后的视频数据仍可以以帧为单位进行编辑。帧内压缩一般达不到很高的压缩。采用帧间（Interframe）压缩是基于许多视频或动画的连续前后两帧具有很大的相关性，或者说前后两帧信息变化很小的特点。也即连续的视频其相邻帧之间具有冗余信息，根据这一特性，压缩相邻帧之间的冗余量就可以进一步提高压缩量，减小压缩比。帧间压缩也称为时间压

34、缩（Temporal compression），它通过比较时间轴上不同帧之间的数据进行压缩。帧间压缩一般是无损的。帧差值（Frame differencing）算法是一种典型的时间压缩法，它通过比较本帧与相邻帧之间的差异，仅记录本帧与其相邻帧的差值，这样可以大大减少数据量。MPEG制定的视频编码标准有MPEG-1（1990年）、MPEG-2（1994年）、MPEG-4（完善中）。其中MPEG-1、MPEG-2基本已经定稿，使用的基本技术和H.26X相同。MPEG-1、MPEG-2的特点在于针对的应用主要是数字存储媒体，码率高，它们并不适于无线视频传输。人们熟知的VCD、DVD是MPEG-1、M

35、PEG-2的典型应用。随后，MPEG组织注意到了低比特率应用潜在的巨大市场，开始和ITU-T进行竞争。在 MPEG-4的制定中，不仅考虑了高比特率应用，还特别包含了适于无线传输的低比特率应用。MPEG-4标准的最大特点是基于视频对象的编码方法。无线通信终端是多种多样的，其所处的网络结构、规模也是互异的。视频码流的精细可分级性（Fine Granularity Scalability）适应了传输环境的多样性。编码协议并不提供完全齐备的解决方案。一般来说，协议内容主要包括码流的语法结构、技术路线、解码方法等，而并未严格规定其中一些关键算法，如运动估计算法、码率控制算法等。运动估计算法在第3部分有较

36、为详细的介绍。码率控制方案在第4部分有较为详细的介绍。2 其他视频压缩编码技术除上述基于协议的视频标准之外，还有一些优秀的算法由于商业的原因，暂时没有被国际标准完全接纳。典型的例子是DCT变换和小波变换之争。虽然利用小波变换可以取得更好的图像恢复质量，但是因为DCT变换使用较早，有很多商业产品的支持，因此小波变换很难在一夜之间取代DCT变换现有的地位。其他编码方法如，分形编码、基于模型的编码方法、感兴趣区优先编码方法等也都取得了一定的成果，具有更强的压缩能力。但是算法实现过于复杂，达到完全实用尚有一段距离。在基于小波的低比特率图像压缩算法的研究中，根据小波图像系数的空间分布特性，以及小波多分辨

37、率的视频特点，人们引入矢量量化以充分利用小波图像系数的相关性。根据传统的运动补偿难以与小波变换相结合这一情况，人们还提出了将空间二维帧内小波变换与时间轴一维小波变换相结合的三维小波变换方法。国际电信联盟（ITU-T）已经制定的视频编码标准包括H.261（1990年）、H.263（1995年）、H.263+（1998年），2000年 11月份将通过H.263+的最终文本。H.26X系列标准是专门用于低比特率视频通信的视频编码标准，具有较高的压缩比，因此特别适合于无线视频传输的需要。它们采用的基本技术包括：DCT变换、运动补偿、量化、熵编码等。H.263+和H.263+中更增加考虑了较为恶劣的无线

38、环境，设计了多种增强码流鲁棒性的方法，定义了分线编码的语法规则。MPEG制定的视频编码标准有MPEG-1（1990年）、MPEG-2（1994年）、MPEG-4（完善中）。其中MPEG-1、MPEG-2基本已经定稿，使用的基本技术和H.26X相同。MPEG-1、MPEG-2的特点在于针对的应用主要是数字存储媒体，码率高，它们并不适于无线视频传输。人们熟知的VCD、DVD是MPEG-1、MPEG-2的典型应用。随后，MPEG组织注意到了低比特率应用潜在的巨大市场，开始和ITU-T进行竞争。在 MPEG-4的制定中，不仅考虑了高比特率应用，还特别包含了适于无线传输的低比特率应用。MPEG-4标准的

39、最大特点是基于视频对象的编码方法。人类的视觉是一种积极的感受行为，不仅与生理因素有关，还取决于心理因素。人们观察与理解图像时常常会不自觉地对某引起区域产生兴趣。整幅图像的视觉质量往往取决于感兴趣区（ROI：Region of Interest）的图像质量。在保障ROI区部分图像质量的前提下，其他部分可以进行更高的压缩。这样在大大压缩数据量的同时，仍有满意的图像恢复质量。这就是感兴趣区优先编码策略。MPEG-2视频结构层：1. 视频序列(Video Sequence)一个视频序列（也称图象序列）由一系列图象组（GOP）组成。2图象组(Group of Pictures) 图象组是由连续的几个图象

40、组成，这些图象被分为I、P、B三种编码图象帧，GOP是编码后视频码流进行编辑的随机存取视频单元，进入点应在I帧的起始端。3. 图象（Pictures）图象是一个独立的显示单元，也是图象编码的基本单元，分为I、P、B三种编码图象。4像条（Slice）像条由一系列连续的宏块组成。像条的宏块应处在同一水平宏块行内。象条是发生误码后且不可纠正时，数据重新获得同步从而能正常解码的基本单元。对于720576象素的画面来说，一帧图象里有36个宏块排（1636=576），宏块排内可以各自有不同的像条划分方法。一个宏块排内像条数最少为1个，如果每个宏块排内像条数多，则有利于误码后的重新正确解码，但确增加了码流

41、中附加的信息，从而降低编码效率变。5宏块(Macroblock)一个宏块由一个1616象素的亮度阵列和相应区域内的Cb 、Cr 色差信号阵列共同组成，它是运动预测的基本单元，以宏块为单位得到一个个宏块最佳匹配的运动矢量。但运动预测只对亮度阵列进行，色差阵列的帧间编码使用亮度阵列中得到的运动矢量。在MPEG-1中图象的色度格式是4:2:0，而在MPEG2中图象的色度格式还包括4:2:2和4:4:4格式。6块（Block）一幅图象以亮度数据阵列为基准被分成为若干个88象素的阵列，简称为块。它是DCT变换编码的基本单元。MPEG-2有三种图像编码：帧内编码图象、前向预测编码图象、双向预测编码图象。帧

42、内编码图象简称“I帧”，I帧是只使用本帧内的数据进行编码的图象。即只对本帧内的图象象块进行DCT变换、量化和熵编码等压缩处理。在一个图象组（GOP）中的第一个编码帧应为I帧；前向预测编码图象简称“P帧”，P帧是根据前面最靠近的I帧或P帧作为参考帧进行前向预测编码的图象。由于P帧使用了运动补偿压缩方法，压缩比高于I帧，双向预测编码图象简称“B帧”。B帧是根据一个过去的参考帧和一个将来的参考帧进行双向预测的编码图象。其参考帧可以是一个I帧和P帧，或是前后两个P帧。由于B帧是在两个参考帧基础上双向预测得出的，它的预测精度能做到很高，其压缩比较大。有了I、P、B帧的组合，可以既得到较高的综合码率压缩比

43、，又保证图象质量。当P帧的宏块进入编码器时，前面的I帧已经存储在I帧存储器中作为参考帧。运动估计器ME（ Motion Estimation）在I帧中搜索与P帧输入宏块最佳的匹配宏块。在I帧搜索到的最匹配宏块相对于P帧宏块的位置就是运动矢量MV（Motion Vector）。运动矢量分为两路输出，一路送到熵编码器中进行编码，另一路送入运动检测器中，同时I帧图象也输入到MC中。根据运动矢量坐标以及P帧宏块的位置找到I帧中的匹配宏块。该宏块由运动检测器输出向上分为两路，一路进入减法器与P帧宏块相减得预测误差。当B帧的宏块进入编码器时，参考帧I、P帧或P、P帧已经储存在I帧和P帧存储器内作为参考帧。

44、运动估计器，进行双向运动预测。找到两个运动矢量后，分两路输出，一路送到熵编码器，另一路送到运动补偿预测器，同时I帧和P帧也一起输到此预测器。由B帧宏块位置和两个运动矢量MV1、MV2，可以分别找到I帧的匹配宏块和P帧的匹配宏块，将它们按比例相加后，由预测器输出，作为帧间预测值。然后进入减法器与B帧宏块相减得预测误差。预测误差经过DCT和量化器后，直接进入熵编码器，由于B帧不作为基准帧。MPEG-4视频编码我们的视频监控系统当中采用的是MPEG-4的编码方案，与MPEG-2不同，MPEG-4并不仅仅着眼于定义不同码流下的压缩编码标准，而是更多的强调多媒体通信的交互性和灵活性，以及多工业领域的融合

45、。下面对其编码技术予以阐述。MPEG-4视频编码功能与特点（1）MPEG-4标准的主要特征就是采纳了基于对象(Object-Based)的编码等第二代编码技术。所谓的对象是在一个场景中能够访问和操纵的实体，对象的划分可以根据其独特的纹理运动、形状、模型和高层语义为依据。这种编码是一种基于内容的数据压缩方式,如将图像分割为运动物体对象和静止不动的背景对象平面，并对这两个对象进行分别处理。背景对象可以采用压缩比较高的办法进行编码，运动物体对象采用压缩比较低、损失比较小的办法，这样就在压缩效率和解码图像质量间得到较好的平衡。基于对象的编码除了能提高数据的压缩比，还能实现许多基于内容的交互性功能，允

46、许将场景中的运动对象同与此对象相关的信息连接起来，从而就可以实现很多应用如基于内容的多媒体数据存取等。（2）MPEG-4可以对不同来源的视音频对象进行合成。视音频对象可以是自然的（摄像机或麦克风捕捉到的）也可以是人工合成的；这些对象可以是单声道、立体声和多声道音频，2D和3D立体视频，也可以是计算机图形，动画，文字等。各种对象通过各自的解码工具进行解码，同时可以创建新的视音频对象。（3）基于对象的分级功能是MPEG-4提供的又一个新的功能，同时兼容于MEPG-2标准中的图像分级功能，分级工具主要用于因特网和无线网等窄带的视频通信、多质量视频服务和多媒体数据库预览等服务。MPEG-4的结构和语法

47、MPEG-4视觉场景 (visual scene) 可能包含一个或多个视讯对象，每个视讯对象都可藉由时间和空间信息加以描述，包括它们的形状、移动和纹理。某些应用可能无法使用所有的MPEG-4工具，原因可能是相关的额外处理负担过于庞大，或是视讯对象的产生极为困难，此时MPEG-4视讯可直接对矩形图框 (rectangular frame) 进行编码，它也是各种形状对象中最简单的一种 (degenerate cases)。MPEG-4视觉位串流会提供阶层式的视觉场景描述，起始码 (start codes) 则是特殊的编码值，它们可以存取位串流的每一层阶层架构。阶层架构中的各层包括：视觉对象序列 (

48、Visual Object Sequence，简称VS)：它是完整的MPEG-4场景，可能包含任何2-D或是3-D的自然或合成对象以及它们的加强层 (enhancement layer)。视讯对象 (Video Object，简称VO)：视讯对象会连结至场景中的某个2D元素，矩形图框就是最简单的例子；它也能是任意形状的对象，对应于场景中的某个对象或是背景。视讯对象层 (Video Object Layer，简称VOL)：视讯对象支持可延展 (scalable) 以及不可延展 (non-scalable) 两种编码模式，实际编码模式则由视讯对象层所代表的应用决定。视讯对象层能支持可延展性编码。视讯对象平面群 (Group of Video Object Planes，简称GOV)：视讯对象平面群是可选用的功能，它会提供视讯对象平面被独立编码的各点，让位元串流中能够加入多个随机存取点。讯对象平面 (Video Object Planes，简

展开阅读全文