《图像处理基础知识.ppt》由会员分享,可在线阅读,更多相关《图像处理基础知识.ppt(32页珍藏版)》请在三一办公上搜索。
1、图像处理基础,颜色模型、色彩空间、图像格式和视频格式,颜色模型,在图形学领域定义的颜色模型,就是在某种特定上下文中对于颜色的特性和行为的解释方法。一般对色彩的讨论都是基于通过红、绿、蓝三原色混合而产生其它颜色的成色机制。RGB颜色模型最便于诸如视频监视器或打印机等硬件设备上表示颜色。但在具体的图形应用中,我们还会用到其它的一些颜色模型。,HSV模型,HSV模型是面向用户的,是一种复合主观感觉的色彩模型。H、S、V分别指的是色调(彩)(hue)、色饱(saturation)和度和明度(value)。所以在这个模型中,一种颜色的参数便是H、S、V三个分量构成的三元组。,HSV模型,HSV模型不同于
2、RGB模型的单位立方体,而是对应于一个圆柱坐标系中的一个立体锥形子集。在这个锥型中,边界表示不同的色彩。H分量表示颜色的种类,取值范围为01,相应的颜色从红、黄、绿、蓝绿、蓝、紫到黑变化,且它的值由绕V轴的旋转角决定,每一种颜色和它的补色之间相差180。,HSV模型,YCbCr模型,YCbCr模型又称为YUV模型,是视频图像和数字图像中常用的色彩模型。在YCbCr模型中,Y为亮度,Cb和Cr共同描述图像的色调(色差),其中Cb、Cr分别为蓝色分量和红色分量相对于参考值的坐标。YCbCr模型中的数据可以是双精度类型,但存储空间为8位无符号整型数据空间,且Y的取值范围为16235,Cb和Cr的取值
3、范围为16240。在目前通用的图像压缩算法中(如JPEG算法),首要的步骤就是将图像颜色空间转换为YCbCr空间。,NTSC模型,NTSC模型是一种用于电视图像的颜色模型。NTSC模型使用的是色彩坐标系,其中,Y为光亮度,表示灰度信息;I为色调,Q为饱和度,均表示颜色信息。因此,该模型的主要优点就是将灰度信息和颜色信息区分开来。,色彩空间,色彩空间,通俗一点讲,就是各种色彩的集合,色彩的种类越多,色彩空间越大,能够表现的色彩范围即色域越广。有两类色彩空间,一类是基于RGB模型的色彩空间,另一类是CMYK色彩空间,Lab色彩空间,由国际照明协会(CIE)在1931年制定包括人眼所能看到的所有颜色
4、是目前为止色域最宽的色彩空间,其每一色值组合对应一种确定的、与设备无关的色彩。“理论化”的色彩,使不同设备的色彩能够相互比较、模拟和匹配。在输出、输入设备有限的色域范围内安全地进行色彩传递,几种颜色空间的色域,RGB色彩空间,RGB对应的是红绿蓝三种原色光,这是因为自然界的所有颜色都可以用这三种光混合而成。在描述时,用R、G、B作为相互垂直的坐标轴来表示,是一种加光模式RGB色彩空间在色彩的处理过程中主要是用来描述像显示器、电视、扫描仪、数字相机等设备的以显示器为例,三种基色的中每一种都有一个0255的值的范围,通过对红、绿、蓝的各种值进行组合来改变象素的颜色。所有基色的相加便形成白色。反之,
5、当所有的基色的值都为0时,便得到了黑色。RGB色彩空间又有Adobe RGB、Apple RGB、sRGB、ColorMatch RGB、Wide Gamut RGB、CIE GB、Monitor RGB/Simplified Monitor RGB等几种,sRGB(标准RGB)色彩空间,由微软与惠普于1997年联合确立,是基于PC的32位色彩空间。目前,被广泛地应用于显示器、打印机、扫描仪等设备,用以提高它们与打印输出设备间的色彩匹配,保证色彩的一致性同样采用sRGB色彩空间的设备之间,可以实现色彩相互模拟,但却是通过牺牲色彩范围来实现各种设备之间色彩的一致性的,这是所有RGB色彩空间中最狭
6、窄的一个sRGB也称“互联网标准色空间”,与普通的个人电脑监视器的特性相匹配,普通电脑显示器一般无法再现超越sRGB空间色域的图象。通常在电脑监视器上再现的图象色彩比sRGB图象更浅些。,Adobe RGB色彩空间,Adobe RGB由Adobe 公司在1998年制定,其雏形最早用在Photoshop 5.x中,被称为SMPTE-240M具备非常大的色彩范围,其绝大部分色彩却又是设备可呈现的,这一色彩空间全部包含了CMYK的色彩范围,为印刷输出提供了便利,可以更好地还原原稿的色彩,在出版印刷领域得到了广泛应用高端数码相机采用Adobe RGB色彩空间,层次较丰富,但色彩饱和较低,Adobe R
7、GB 色域的显示问题,Adobe RGB 的色域比一般的 sRGB 色域更广,更接近人肉眼所能感知的颜色,所以广为专业制作人员所应用。主流显示器只能输出 8-bit sRGB 色域,如果采用 Adobe RGB 色域处理数码相片时可能会出现蓝色区域无法正确显示的问题,从而导致偏色。采用 10 bit color 时,色阶大为广阔,能有更广阔的色域,可解决 Adobe RGB 的色域问题。采用10 bit color,需显示器、显卡和应用程序的支持,如Adobe 的 Photoshop CS4、CS5 绘图编辑软件等已经支持。,CMYK色彩空间,CMYK色彩空间,是一种减光模式,它是四色打印的基
8、础。这四色是:青(Cyan)、品红(Magenta)、黄(Yellow)、黑(Black)。青色是红色的互补色。黄色是蓝色的互补色,品红是绿色的互补色,当阳光照射一物体时,物体吸收部分光线,并将其它光线反射。反射光就是我们所看见的物体颜色,这是一种减色模式。依赖于这种减色方式,演变出了适合于打印、印刷的CMYK模式。由于在实际中这三种颜色的油墨很难叠加出真正地黑色,因此在打印、印刷时又引入了黑色以强化暗调,加深暗部色彩。在CMYK模式下,每一种颜色都是以这四色的百分比来表示的,原色的混合将产生更暗的颜色。,数字图像的类型,RGB图像,采用RGB彩色模型的真彩图像。不需使用调色板。每个像素的颜色
9、由像素位置上红、绿、蓝亮度的组合确定。灰度图像,只包含亮度信息,不包含色彩信息的图像。灰度图像是一个数据矩阵I,其值表示一定范围内的亮度值。二值图像,每个像素的值仅为0或1的图像,是黑白图像。存储空间小、处理速度快。通过二值图像,可比较容易地获取目标区域的特征,便于图像分析和识别。索引图像,是一种把像素值直接作为RGB调色板下标的图像。调色板通常与索引图像存储在一起,装载图像时,调色板将和图像一同自动装载。,数字图像的文件格式,图像格式与图像类型不同,指的是存储图像采用的文件格式。不同的操作系统、不同的图像处理系统,所支持的图像格式都有可能不同。在实际应用中常用到以下几种图像格式:BMP、JP
10、EG、JPEG 2000、TIFF/TIF、PCX、PSD、PNG、GIF格式等。在这些图像格式中,我们使用最多的就是BMP、JPEG和PNG三种。,BMP格式,BMP是是一种与硬件设备无关的,Windows操作系统中的标准图像文件格式。随着Windows操作系统的流行,BMP位图格式理所当然地被广泛应用。这种格式的特点是包含的图像信息较丰富,占用磁盘空间过大。目前BMP在单机上比较流行。BMP文件的图像深度可选lbit、4bit、8bit及24bit。BMP文件存储数据时,图像的扫描方式是按从左到右、从下到上的顺序。典型的BMP图像文件由三部分组成:位图文件头,它包含BMP图像文件的类型、显
11、示内容等信息;位图信息,它包含有BMP图像的宽、高、压缩方法;图像数据。,JPEG格式,JPEG也是常见的一种图像格式,它由联合照片专家组(Joint Photographic Experts Group)开发并以命名为ISO 10918-1,JPEG仅仅是一种俗称而已。它用有损压缩方式去除冗余的图像和彩色数据,获取得极高的压缩率的同时能展现十分丰富生动的图像。JPEG还是一种很灵活的格式,具有调节图像质量的功能,允许你用不同的压缩比例对这种文件压缩。完全可以在图像质量和文件尺寸之间找到平衡点。JPEG的应用也非常广泛,特别是在网络和光盘读物上,。目前各类浏览器均支持JPEG这种图像格式,因为
12、JPEG格式的文件尺寸较小,下载速度快,使得Web页有可能以较短的下载时间提供大量美观的图像。,JPEG2000格式,JPEG 2000同样是由JPEG 组织负责制定的,它有一个正式名称叫做“ISO 15444”,是JPEG格式的升级版,其压缩率比JPEG高约30%左右。与JPEG不同的是,JPEG2000 同时支持有损和无损压缩,而 JPEG 只能支持有损压缩。JPEG2000的一个极其重要的特征在于它能实现渐进传输,这一点与GIF的渐显有异曲同工之妙,即先传输图像的轮廓,然后逐步传输数据,不断提高图像质量,让图象由朦胧到清晰显示,而不必是像现在的 JPEG 一样,由上到下慢慢显示。JPEG
13、2000还支持所谓的感兴趣区域特性,任意指定影像上你感兴趣区域的压缩质量,还可以选择指定的部份先解压缩。JPEG 2000 和 JPEG 相比优势明显,且向下兼容,因此取代传统的JPEG格式指日可待。JPEG2000可应用于传统的JPEG市场,如扫描仪、数码相机等,亦可应用于新兴领域,如网路传输、无线通讯等等。,TIFF图像文件格式,TIFF格式 TIFF(Tag Image File Format)是一种广泛使用的图像格式,由Aldus和微软联合开发,最初是出于跨平台存储扫描图像的需要而设计的。特点是图像格式复杂、存贮信息多。因为它存储的图像细微层次的信息多,图像质量也得以提高,有利于原稿的
14、复制。TIFF支持多种编码,包括RGB无压缩、RLE压缩及JPEG压缩。TIFF图像文件由三个数据结构组成,分别为文件头、若干称为IFD的包含标记指针的目录以及数据本身。TIFF图像文件中的第一个数据结构称为图像文件头或IFH。这个结构是一个TIFF文件中唯一的、有固定位置的部分;IFD图像文件目录是一个字节长度可变的信息块,Tag标记是TIFF文件的核心部分,在图像文件目录中定义了要用的所有图像参数,目录中的每一目录条目就包含图像的一个参数。TIFF是现存图像文件格式中最复杂的一种,具有扩展性、方便性、可改性,是微机上使用最广泛的图像文件格式之一。,GIF格式,GIF即Graphics In
15、terchange Format(图形交换格式),是上世纪80年代美国的CompuServe针对当时网络传输带宽的限制开发出来的图像格式。GIF格式的特点是压缩比高,磁盘空间占用较少,所以这种图像格式迅速得到了广泛的应用。最初的GIF只是简单地用来存储单幅静止图像(GIF87a),后来可同时存储若干幅静止图象进而形成连续的动画,是当时支持2D动画几种格式之一(称为GIF89a),甚至可指定透明区域,使图像具有非同一般的显示效果。目前网上大量采用的彩色动画文件多为这种格式。此外,考虑到网络传输中的实际情况,GIF图像格式还增加了渐显方式,即在图像传输过程中,用户可先看到图像的大致轮廓,然后随着传
16、输过程的继续而逐步看清图像中的细节部分,从而适应了用户的“从朦胧到清楚”的观赏心理。GIF不能存储超过256色的图像。尽管如此,这种格式仍在网络上大行其道,这和GIF图像文件短小、下载速度快、可用许多具有同样大小的图像文件组成动画等优势是分不开的。,PSD格式和PNG格式,PNG(Portable Network Graphics)是一种新兴的网络图像格式。1994由于Unysis公司宣布GIF拥有专利的压缩方法,从而促使结合GIF及JPG两家之长的PNG 诞生,96年10月由PNG向国际网络联盟提出并得到推荐认可。它能把图像文件压缩到极限以利于网络传输,但又能保留所有与图像品质有关的信息;它
17、的另一个特点是显示速度很快,只需下载1/64的图像信息就可以显示出低分辨率的预览图像;PNG还支持透明图像的制作。PNG的缺点是不支持动画应用效果,如果在这方面能有所加强,简直就可以完全替代GIF和JPEG了。如今在网络上比较流行这种格式。PSD格式是Adobe公司的图像处理软件PS的专用格式Photoshop Document(PSD)。PSD其实是PS进行平面设计的一张草图,包含有各种图层、通道、遮罩等多种设计的样稿,以便于下次打开文件时可以修改上次的设计。在PS所支持的各种图像格式中,PSD的存取速度比其它格式快很多,功能也很强大。由于PS越来越被广泛地应用,相信这种格式也会逐步流行起来
18、。,AVI格式,AVI格式:它的英文全称为Audio Video Interleaved,即音频视频交错格式。它于1992年被Microsoft公司推出,随Windows3.1一起被人们所认识和熟知。所谓“音频视频交错”,就是可以将视频和音频交织在一起进行同步播放。这种视频格式的优点是图像质量好,可以跨多个平台使用,其缺点是体积过于庞大,而且更加糟糕的是压缩标准不统一,最普遍的现象就是高版本Windows媒体播放器播放不了采用早期编码编辑的AVI格式视频,而低版本Windows媒体播放器又播放不了采用最新编码编辑的AVI格式视频,所以我们在进行一些AVI格式的视频播放时常会出现由于视频编码问题
19、而造成的视频不能播放或即使能够播放,但存在不能调节播放进度和播放时只有声音没有图像等一些莫名其妙的问题,如果用户在进行AVI格式的视频播放时遇到了这些问题,可以通过下载相应的解码器来解决。,nAVI格式,nAVI是newAVI的缩写,是一个名为ShadowRealm的地下组织发展起来的一种新视频格式(与上述AVI格式没有太大联系)。由Microsoft ASF压缩算法的修改而来的,但是又与下面介绍的网络影像视频中的ASF视频格式有所区别,它以牺牲原有ASF视频文件视频“流”特性为代价而通过增加帧率来大幅提高ASF视频文件的清晰度。DV-AVI格式:DV的英文全称是Digital Video F
20、ormat,是由索尼、松下、JVC等多家厂商联合提出的一种家用数字视频格式。目前非常流行的数码摄像机就是使用这种格式记录视频数据的。它可以通过电脑的IEEE 1394端口传输视频数据到电脑,也可以将电脑中编辑好的的视频数据回录到数码摄像机中。这种视频格式的文件扩展名一般是.avi,所以也叫DV-AVI格式。,MPEG格式,它的英文全称为Moving Picture Expert Group,即运动图像专家组格式,家里常看的VCD、SVCD、DVD就是这种格式。MPEG文件格式是运动图像压缩算法的国际标准,它采用了有损压缩方法减少运动图像中的冗余信息,说的更加明白一点就是MPEG的压缩方法依据是
21、相邻两幅画面绝大多数是相同的,把后续图像中和前面图像有冗余的部分去除,从而达到压缩的目的(其最大压缩比可达到200:1)。目前MPEG格式有三个压缩标准,分别是MPEG1、MPEG2、和MPEG4,另外,MPEG-7与MPEG-21仍处在研发阶段。,MPEG格式,MPEG1:制定于1992年,它是针对1.5Mbps以下数据率的数字存储媒体运动图像及伴音编码而设计的国际标准。即VCD制作格式。使用MPEG-1,可把一部120分钟长的电影压缩到1.2GB左右大小。这种视频格式的文件扩展名包括.mpg、.mlv、.mpe、.mpeg及VCD光盘中的.dat文件等。MPEG2:制定于1994年,目标为
22、高级工业标准的图像质量以及更高的传输率。主要应用在DVD/SVCD的制作(压缩)方面,同时在一些HDTV和一些高要求视频编辑、处理上面也有相当的应用。这种视频格式的文件扩展名包括.mpg、.mpe、.mpeg、.m2v及DVD光盘上的.vob文件等。,MPEG格式,MPEG3(MPEG AUDIO LAYER 3)是一种具有高压缩率的音响信号文件。可与CD/MD的音质媲美。MP3高达10比1的压缩比率。MPEG4:制定于1998年,MPEG4是为了播放流媒体的高质量视频而专门设计的,它可利用很窄的带宽,通过帧重建技术,压缩和传输数据,以求使用最少的数据获得最佳的图像质量。目前MPEG-4最有吸
23、引力的地方在于它能够保存接近于DVD画质的小体积视频文件。另外,还包含了以前MPEG压缩标准所不具备的比特率的可伸缩性、动画精灵、交互性甚至版权保护等特殊功能。这种视频格式的文件扩展名包括.asf、.mov和DivX AVI等。,H.264格式,H.264是目前最先进的编码格式,这种编码的视频一般被封装在MP4的格式中使用,即H264编码的视频一般的格式都是MP4格式,这种格式的文件非常小,清晰度非常高。H.264是ITU-T的VCEG(视频编码专家组)和ISO/IEC的MPEG(活动图像编码专家组)的联合视频组(JVT:joint video team)开发的一个新的数字视频编码标准,它既是
24、ITU-T的H.264,又是ISO/IEC的MPEG-4的第10 部分。98年1月开始草案征集,次年9月完成首个草案,01年5月制定了其测试模式TML-8,02年6月的 JVT第5次会议通过了H.264的FCD板,03年3月正式发布。,H.264格式,H.264与以前的国际标准如H.263和MPEG-4相比,最大优势体现在以下四个方面:将每个视频帧分离成由像素组成的块,因此视频帧的编码处理的过程可以达到块的级别。采用空间冗余的方法,对视频帧的一些原始块进行空间预测、转换、优化和熵编码(可变长编码)。对连续帧的不同块采用临时存放的方法,这样,只需对连续帧中有改变的部分进行编码,采用运动预测和运动
25、补偿来完成。对某些特定的块,在一个或多个已经进行了编码的帧执行搜索来决定块的运动向量,并由此在后面的编码和解码中预测主块。采用剩余空间冗余技术,对视频帧里的残留块编码。如:对于源块和相应预测块的不同,再次采用转换、优化和熵编码。,H.264格式,H.264是国际标准化组织ISO和国际电信联盟ITU共同提出的继MPEG4之后的新一代数字视频压缩格式,既保留了以往压缩技术的优点和精华又具有其他压缩技术无法比拟的许多优点。低码率:和MPEG2和MPEG4 ASP等压缩技术相比,在同等图像质量下,采用H.264技术压缩后的数据量只有MPEG2的1/8,MPEG4的1/3。显然,H.264压缩技术的采用
26、将大大节省用户的下载时间和数据流量收费。高质量的图象:H.264能提供连续、流畅的高质量图象(DVD质量)。容错能力强:H.264提供了解决在不稳定网络环境下容易发生的丢包等错误的必要工具。网络适应性强:H.264提供了网络抽象层(Network Abstraction Layer),使得H.264的文件能容易地在不同网络上传输(例如互联网,CDMA,GPRS,WCDMA,CDMA2000等)。,其他视频格式,ASF格式:即Advanced Streaming format,微软推出,使用MPEG-4的压缩算法。WMV格式:即Windows Media Video,微软推出,采用独立编码方式,可直接在网上实时观看视频节目的文件格式。RM格式:Real Networks公司所制定,用户可使用RealPlayer播放,从而实现在低速率的网络上进行影像数据实时传送和播放,可实现在线播放。RMVB格式:RM的升级格式,打破了RM格式平均压缩采样的方式,在保证平均压缩比的基础上合理利用比特率资源。,