多媒体数据.docx

上传人:小飞机 文档编号:2019140 上传时间:2022-12-31 格式:DOCX 页数:67 大小:980.78KB
返回 下载 相关 举报
多媒体数据.docx_第1页
第1页 / 共67页
多媒体数据.docx_第2页
第2页 / 共67页
多媒体数据.docx_第3页
第3页 / 共67页
多媒体数据.docx_第4页
第4页 / 共67页
多媒体数据.docx_第5页
第5页 / 共67页
点击查看更多>>
资源描述

《多媒体数据.docx》由会员分享,可在线阅读,更多相关《多媒体数据.docx(67页珍藏版)》请在三一办公上搜索。

1、第3章 多媒体数据【本章要点】【核心概念】3.1 多媒体数据类型3.1.1 文字3.1.2 音频3.1.3 视觉媒体3.1.4 动画3.2 多媒体数据的描述3.2.1 静态图像文件3.2.2 动态图像文件3.2.3 音频文件第章 多媒体数据压缩技术【本章要点】【核心概念】4.1 数据压缩基本原理4.1.1信息、数据和编码4.1.2数据压缩的条件4.1.3数据冗余4.2 数据压缩算法4.2.1数据压缩算法的分类4.2.2预测编码4.2.3变换编码4.2.4统计编码原理4.2.5 LZW压缩编码4.3 音频信号的压缩编码4.3.1音频信号编码基础4.3.2音频信号的压缩编码算法4.3.3音频信号压

2、缩编码标准及评估4.4 视频信号的压缩编码4.4.1彩色空间和变换4.4.2 JPEG静止图象压缩算法4.4.3 MPEG运动图像压缩算法第3章 多媒体数据【本章要点】 本章主要介绍了文字、音频、视觉媒体、动画四种多媒体数据类型,另外从静态图像文件、动态图像文件以及音频文件三个方面对多媒体数据进行了详细的描述。为今后各章的学习打好理论基础。【核心概念】文字 音频 视觉媒体 动画 单色图像 彩色图像 模拟信号 数字信号3.1 多媒体数据类型3.1.1 文字 文字是人与计算机之间进行信息交换的主要媒体。在计算机发展的早期,比较实用的终端为一般文字终端,在屏幕上显示的都是文字信息。由于人们在现实生活

3、中用语言进行交流,所以开始时文字终端比较流行,但是后来出现了图形、图像、声音等媒体,这样也就相应地出现了多种终端设备。在现实世界中,文字是人们进行通信的主要形式,文字包括西文与中文。在计算机中,文字用二进制编码表示,即使用不同的二进制编码来代表不同的文字。1西文在计算机中,西文采用ASCII码表示。ASCII是美国信息交换标准代码(American Standard Code for Information Interchange)的英文缩写。它是一个由7个二进制位组成的字符编码系统,包括大小写字母、标点符号、阿拉伯数字、数学符号、控制字符等128个字符。目前,ASCII码已在计算机领域中得到

4、了最广泛的应用。例如,字符A的ASCII码值为065;字符B的为066;字符C的为067。2 中文(1) 中文的输入编码 中文与西文不同,因此为了能直接使用西文标准键盘把汉字输入到计算机,就必须为中文汉字设计相应的输入编码方法。当前采用的方法主要有以下3类: 数字编码 常用的是国标区位码,用数字串代表一个中文汉字输入。区位码是将国家标准局公布的6763个两级汉字分为94个区,每个区分为94位,实际上是把汉字表示成二维数组,每个汉字在数组中的下标就是区位码。区码和位码各两位十进制数字,因此输入一个汉字需按键4次。例如“中”字位于第54区48位,区位码为5448。数字编码输入的优点是无重码,且输入

5、码与内部编码的转换比较方便,缺点是代码难记忆。 拼音码 拼音码是以汉语拼音为基础的输人方法,凡掌握汉语拼音的人,不需训练和记忆,即可使用。但是汉字同音字太多,输人重码率很高,因此按拼音输入后还必须进行同音字选择,影响了输人速度。 字型编码字型编码是用汉字的形状来进行的编码。汉字总数虽多,但是由笔画组成,全部汉字的部件和笔画是有限的。因此,把汉字的笔画部件用字母或数字进行编码,按笔画的顺序依次输入,就能表示一个汉字。例如,五笔字型编码是最有影响的一种字型编码方法。 除了上述3种编码方法外,为了加快输入速度,在上述方法基础上,发展了词组输入、联想输人等多种快速输人方法,但都利用了键盘进行“手动”输

6、入。理想的输人方式是利用语音或图像识别技术“自动”将拼音或文本输入到计算机内,使计算机能认识汉字,听懂汉语,并将其转换为机内代码表示。目前这种理想已经成为现实。 (2)汉字内码 汉字内码是用于汉字信息的存储、交换、检索等操作的机内代码,一般采用两个字节表示。英文字符的机内代码是七位的ASCII码,当用一个字节表示时,最高位为“0”。为了与英文字符能相互区别,汉字机内代码中两个字节的最高位均规定为“l”。例如汉字操作系统CCDOS中使用的汉字内码就是一种最高位为“l”的两字节内码。 有些系统中字节的最高位用于奇偶校验位,这种情况下用3个字节表示汉字内码。(3)汉字字模码字模码是用点阵表示的汉字字

7、形代码,它是汉字的输出形式。根据汉字输出的要求不同,点阵的多少也不同。简易汉字为 1616点阵,提高型汉字为2424点阵、3232点阵,甚至更高。因此字模点阵的信息量很大,所占的存储空间也很大。以1616点阵为例,每个汉字要占用32B,国标两级汉字要占用256KB。因此字模点阵只能用来构成汉字库,而不能用于机内存储。字库中存储了每个汉字的点阵代码。当显示输出或打印输出时才检索字库,输出字模点阵,得到字形。汉字的输人编码、汉字内码、字模码是计算机中用于输人、内部处理、输出3种不同用途的编码,不要混为一谈。汉字的数目很多,常用的汉字就有几千个。现在常用的汉字可用2B表示,而要表示更多的汉字时,还要

8、用更多的字节。在中国使用计算机,汉字是必须考虑的。3.1.2 音频 音频(Audio)指的是20HZ20kHz的频率范围,但实际上“音频”常常被作为“音频信号”或“声音”的同义语,是属于听觉类媒体,主要分为波形声音、语音和音乐。l 波形声音所谓波形声音,实际上包含了所有的声音形式。因为在计算机中,任何声音信号都要首先对其进行数字化(可以把麦克风、磁带录音、无线电和电视广播、光盘等各种声源所产生的声音进行数字化转换),并恰当地恢复出来。l 语音 所谓语音是这样的含义,人的声音不仅是一种波形,而且还有内在的语言、语音学的内涵,可以利用特殊的方法进行抽取,通常把它也作为一种媒体。l 音乐 音乐是符号

9、化了的声音,这种符号就是乐曲。MIDI是十分规范的一种形式。声音具有音调、音强、音色3要素。音调与频率有关,音强与幅度有关,音色由混入基音的泛音所决定的。没有时间也就没有声音,声音数据具有很强的前后相关性,数据量大、实时性强,又由于声音是连续的,所以通常将其称为连续型时基媒体类型。1数字音频数字音频是指音频信号用一系列的数字表示,其特点是保真度好、动态范围大。在计算机内的音频必须是数字形式的,因此必须把模拟音频信号转换成有限个数字表示的离散序列,即实现音频数字化。在这一处理技术中,要考虑采样、量化和编码的问题。一个音频信号转换成在计算机中的表示过程如下:选择采样频率,进行采样;选择分辨率,进行

10、量化;形成声音文件,如图3-1所示。(1)采样(Sampling)采样有时也称为数字化,其作用是把时间上连续的信号,变成在时间上不连续的信号序列。声音进入计算机的第一步就是数字化,数字化实际上就是采样和量化。连续时间的离散化通过采样来实现,就是每隔相等的一小段时间采样一次,这种采样称为均匀采样(uniform sampling);连续幅度的离散化通过量化(quantization)来实现,就是把信号的强度划分成一小段一小段,如果幅度的划分是等间隔的,就称为线性量化,否则就称为非线性量化。图3-2表示了声音数字化的概念。 根据采样定理,采样的频率至少高于信号最高频率的2倍。采样的频率越高,声音“

11、回放”出来的质量也越高,但是要求的存储容量也就越大。在多媒体中,对于音频,最常用的有 3种采样频率,即44.1kHz、22 .05kHz和11.025kHz,其中,22. 05kHz和 44.1kHz是最常采用的频率。图3-1 音频信号处理过程 图3-2 声音的采样和量化 (2)分辨率音频的另一个指标是“分辨率”,它是指把采样所得的值(通常为反映某一瞬间声波幅度的电压值)数字化,即用二进制来进示模拟量,进而实现模数转换。显然,用来表示一个电压模拟值的二进数位越多,其分辨率也越高。国际标准的语音编码采用8b,即可有256个量化级。在多媒体中,对于音频、分辨率(量化的位数)可采用16b,对应有65

12、536个量化级。 (3)声音文件一般说来,要求声音的质量越高,则量化级数和采样频率也越高,为了保存这一段声音的相应的文件也就越大,就是要求的存储空间越大。表3-1给出了采样频率、分辨率与所要求的文件大小的对应关系。声音通道的个数表明声音记录是只产生一个波形(单声道)还是产生两个波形(立体声双声道)。立体声的声音有空间感,但需要两倍的存储空间。 对于单声道,计算数字录音文件大小的公式为: S= RD(r/8)1其中,S表示文件大小,单位为B;R表示采样速率,也可叫采样频率,单位为kHz;D表示录音的时间,单位为s;r表示分辨率,单位为二进制位(b),如8b、16b等。式中的数字1表示对应的单声道

13、。公式中的“除8”是为了把二进制位换算成以字节作为单位,一个字节等于8个二进制位。 表3-1 采样速率、分辨率与存储空间的关系采样速率/kHz 分辨率/b 立体声或单声道 1min所需字节/MB 44.1 16 立体声 10.5 44.1 16 单声道 5.25 44.1 8 立体声 5.25 44.1 8 单声道 2.6 22.05 16 立体声 5.25 22.05 16 单声道 2.5 22.05 8 立体声 2.6 22.05 8 单声道 1.3 对立体声,计算数字录音文件大小的公式与单声道的情况类似(仍以B为单位): S= RD(r/8)2其中各符号的含义与上式相同,唯一不同的是乘以

14、数字2,表示对应立体声,也就是说,立体声的文件大小为单声道的两倍。 例如,如果采样速率为44.1kHz、分辨率为16b、立体声,上述条件符合CD质量的红皮书音频标准,消费者级的音频压缩盘即按此录制,录音的时间长度为10s的清况下,文件的大小S为: S=(441001016/8)2=1764KB 对音频的数字化来说,在相同条件下,立体声比单声道占的空间大;分辨率越高,占的空间越大;采样速率越高,占的空间越大。总之,对于音频的数字化要占用很大的空间,因此,对音频数字化信号进行压缩是十分必要的。在多媒体技术中,存储声音信息的常用文件格式主要有WAV文件、VOC文件、MIDI文件、AIF文件、SNO文

15、件和RMI文件等。 WAV文件 WAV是Microsoft公司的音频文件格式。利用 Microsoft Sound System软件Sond Finder可以将AIF、SND和VOD文件转换到WAV格式。 WAV文件来源于对声音模拟波形的采样。用不同的采样频率对声音的模拟波形进行采样可以得到一系列离散的采样点,以不同的量化位数(8b或16b)把这些采样点的值转换成二进制数,然后存人磁盘,这就产生了声音的WAV文件,即波形文件。WAV文件是由采样数据组成的,所以它需要的存储容量很大。用前面介绍的公式可以简单地推算出WAV文件所需的存储空间的大小。例如,用44.1kHz的采样频率对声波进行采样,每

16、个采样点的量化位数选用 16b,则录制1s的立体声节目,其波形文件所需的存储容量为:44100162/8=176.4KB 由此可见,WAV文件所需的存储容量相当大。当然,如果对声音质量要求不高,则可以通过降低采样频率,采用较低的量化位数或利用单音来录制WAV文件,此时WAV文件可以成倍地减小。 实践发现,如果录音技术较好,那么用22.05kHz的采样频率和8b的量化位数,也可以获得较好的音质,其效果可达到相当于AM音频的质量水平。 VOC文件VOC文件是Creative公司波形音频文件格式,也是声霸卡使用的音频文件格式。每个VOC文件由文件头块(Header Block)和音频数据块(Data

17、 Block)组成。文件头块包含一个标识、版本号和一个指向数据块起始的指针。数据块分成各种类型的子块,如声音数据、静音、标记、ASCII码文件,重复以及终止标记、扩展块等。VOC格式音频文件的文件头说明如下:00H13H字节:文件类型说明。前19B包含下面的正文:Creative Voice File。最后是EOF字节(1AH);14H15H字节:其值为001AH;16H17H字节:文件的版本号。小数点后面的部分在前。如版本号为1.10,则这两个字节内的值为0A01;18H19H字节:是一个识别码。由这个代码可以检验其文件是否是真正的VOC文件。其值是16H和17H单元中所存文件版本号的反码再

18、加上1234H。例如,版本号为1.10,010AH的反码是FEF5H,则这个代码为FEF5H1234H1129H。利用声霸卡提供的软件可以实现VOC和WAV文件的转换:程序VOC2WAV将Creative的VOC文件转换到Microsoft的WAV文件;程序WAV2VOC将Microsoft的WAV文件转换到Creative的VOC文件。 MIDI文件MIDI(Musical Instrument Digital Interface)是一种技术规范,MIDI文件与WAV文件不同。关于MIDI文件的详细介绍在“乐器数字接口”一节。其他音频文件最重要的是PCM格式,它是模拟的音频信号经数模转换(A

19、/D变换)直接形成的二进制序列,该文件没有附加的文件头和文件结束标志。在声霸卡提供的软件中,可以利用VOCHDR程序,为PCM格式的音频文件加上文件头而形成VOC格式。Windows的Convert工具也可以将PCM音频文件转换成Windows的WAV格式。AIF是Apple计算机的音频文件格式。Windows的Convert工具可以把AIF格式的文件转换成Microsoft的WAV格式的文件。在Windows操作系统中,配置声音文件的操作如下:1. 双击“控制面板”中“多媒体”图标,打开“多媒体属性”对话框。2. 在“录音”项目中单击“自定义”按钮,可以更改录音的收音质量的“采样频率”、“量

20、化位数”、“声道”、“每秒中所需字节”。3. 单击“确定”按钮,设置结束。在第2步也可选择“电话质量”或“CD质量”,进行修改。 2音乐数字接口声音有两类:一类是直接获取的声音,另一类是合成声音。合成声音可以是音乐或语言,合成声音与MIDI有紧密的联系,并已形成标准,而合成语言目前还未形成标准。MIDI是20世纪80年代提出来的,是数字音乐的国际标准。MIDI信息实际上是一段音乐的描述,当MIDI信息通过一个音乐或声音合成器进行播放时,该合成器对一系列的MIDI信息进行解释,然后产生出相应的一段音乐或声音。MIDI能提供详细描述乐谱的协议(音符、音调、使用什么乐器等)。MIDI规定了各种电子乐

21、器和计算机之间连接的电缆和硬件接口标准及设备间数据传输的规程。任何电子乐器,只要有处理MIDI信息的处理器并配以合适的硬件接口,均可成为一个MIDI设备。简明的MIDI信息可以产生复杂的声音或在乐器或在声音合成器上产生出美妙的音乐,因此MIDI文件比数字化波形文件小得多。在计算机上作曲很简单,充分利用交互性、声音合成器和作曲软件,即可通过键盘逐一键入各种音符、音色等。可以不断进行修改或重新再来,直至满意为止,并作为一个音乐文件存入硬盘中。以后,通过播放软件就可以对这个音乐文件进行播放。(1)MIDI文件记录MIDI信息的标准格式文件称为MIDI文件,其中包含音符、定时和多达16个通道的乐器定义

22、以及键号、通道号、持续时间、音量和击键力度等各个音符的有关信息。定义和产生乐曲的MIDI信息和数据组存放于MIDI文件最多可存放16个音乐通道的信息。 音乐器是为MIDI作曲而设计的软件或电子设备,可用来记录、播放及编辑MIDI事件,大多数音序器可输入、输出MIDI文件。当演奏MIDI文件时,音序器将MIDI信息从文件中取出并送至合成器。合成器是使用数字信号处理器或其他类型芯片发出音乐和声音的设备。由该合成器将这些信息转换成某种乐器的声音、合成音色及持续时间,再通过生成并修改波形将它们送至声音发生器和扬声器中输出。由于MIDI文件是一系列指令而不是波形数据的集合,所以要求的存储空间较小。例如,

23、一个典型的8b、22kHz的波形文件,记录1.8s的声音需要316.8KB空间,而一个2min的MIDI文件仅需8KB的空间。由于MIDI文件比波形文件的长度小、安装方便,所以在设计多媒体应用和播放指定音乐时有很大的灵活性。(2) MIDI作品可以购买MIDI现成的作品,也可以自己制作。当然,开发自己的MIDI作品除了必须拥有计算机方面的知识与设备之外,还需要具备专业音乐知识和专用工具。一般情况下,可以使用一个电子键盘乐器和MIDI音序器来逐步完成作品的旋律、低音和弦及打击乐器的配乐,并反复演奏、录制、播放及编辑,直到满意为止。要生成最后的乐谱,必须用音序器录制每个音轨并指定相应的通道。通常,

24、音序器将每个通道的数据作为一个音轨,并允许独立地播放和编辑这些数据。MIDI文件有3种存放格式:格式0、1和2。格式0仅支持单音轨,格式1支持多音轨,大多数音序器支持格式0和格式1,一旦总谱存入了MIDI文件,便可以从应用程序中播放它了。3数字化声音和MIDI的比较与MIDI数据相比,数字化的声音是声音的实际表示。它代表了声音的瞬时幅度。因为它与设备无关,每次播放时它都发出相同的声音。从这一点看,它的一致性好,但代价较高,因其数据文件要求较大的存储空间。MIDI数据是与设备有关的,即MIDI音乐文件所产生的声音与用来播放的特定MIDI设备有关。 (1)MIDI数据的优点 文件紧凑,所占空间小,

25、MIDI文件的大小与回放质量完全无关。通常,MIDI文件比CD质量的数字化声音文件小2001000倍,它不占用较多的内存、外存空间和CPU资源。 在某些情况下,如果所用的MIDI声源较好,声音质量有可能比数字化的更好。 在不需要改变音调或降低音质的情况下,可以通过改变其速度来改变MIDI文件的长度。MIDI数据是完全可编辑的,可以用多种方法来处理它的每一个细节,而在处理数字化声音时,这些方法却完全用不上。(2)MIDI数据的缺点因MIDI数据并不是声音,仅当MIDI回放设备与产生时所指定设备相同时,回放的结果才是精确的。MIDI不能很容易地用来回放语言对话。为创建数字化声音所要求的准备与编程工

26、作,不需要掌握许多音乐理论知识,而MIDI则要求比较多。 在应用软件和系统支持方面,数字化声音都有更多地选择,不管对Macintosh还是Windows平台均如此。(3) 数字化声音和MIDI之间的选择选择MIDI的条件1) 由于没有足够的RAM、硬盘空间或CPU处理能力。2) 具有高质量的声源。3) 对回放的硬件有完全的控制。4) 没有语言对话的需要。选择数字化声音的条件1) 对回放硬件没有完全的控制。2) 有足够的计算资源处理数字文件。3) 有语言对话的需要。3.1.3 视觉媒体能够利用视觉传递信息的媒体都是视觉媒体。位图图像、矢量图像、动态图像、符号等都是视觉媒体。1 位图图像位图图像指

27、在空间和亮度上已经离散化的图像。可以把一幅位图图像考虑为一个矩阵,矩阵中的任一元素对应图像中的一个点,相应的值表示该点的灰度或颜色等级。矩阵的元素为像素,每个像素可以具有不同的颜色和亮度,像素也是能独立地赋予颜色和亮度的最小单位。位图图像适用于逼真照片或要求精细细节的图像。通常,图像文件总是以压缩的方式进行存储的,以节省内存和磁盘空间,静态图像是多媒体项目中最重要的元素。(1)位图的概念 位图图像又称点阵图像或光栅图像,它指一个图像由若干个点(像素)组成。通常,内存中划出一部分空间用作显示存储器,也称帧存储器,其中存放了与屏幕画面上的每一个像素一一对应的一个个矩阵。矩阵中的每一个元素就是像素值

28、,像素值反映了对应像素的某些特性,而这个矩阵就称为位图。简而言之,位图是一个用来描述像素的简单的信息矩阵,如果是单色的(仅有黑、白两种颜色)可用一维矩阵(即位的位图)来表示,而更多的颜色则要用多位信息来表示。例如,4可以表示16种颜色,8b可以表示256种颜色,16b可以表示32768种颜色,而24b则可以表示1600多万种颜色(可达到“照片逼真”的水平)等。可用如图3-5所示的简单的模型来加以说明。图中,有44=16个像素,即这个图像仅有16个像素。用1b位图时每个像素可以有黑白两种颜色,而用24b位图时每个像素则可以有1600多万种颜色。(2)位图的产生方法 用画图程序获得。 用荧光屏抓取

29、程序从荧光屏上直接抓取,然后把它加到画图程序或应用程序中。 用扫描仪或数字化的视频图像抓取设备从照片、艺术作品或电视图像抓取。 购买现成的图像库。厂商把各种图像数字化以后存在磁盘或光盘中,像普通软件一样销售。由于是专业化的开发,规模化的生产,所以有较高的性能价格比。(3)位图的处理 图像的抓取在荧光屏上看到的图像实际上是存储在视频存储器(它是内存的一部分)中的数字位图,大约每1/60s或更短的时间内更新一次,这取决于所用监视器的扫描速度。抓取图像的最简单的方法是在观察到适当图像的某一瞬间按下键盘上的某个键,它引起视频位图在格式上转换到人们将要使用的另外一种位图(在格式上不同)。在Macinto

30、sh和Windows环境中都有一个叫做clipboard的内存区中。当在应用系统中进行剪切和复制时,正文和图像这样的数据都存储在这个内存区中。然后,可以从clipboard中将抓取的位图“粘贴”到像paintbrush(Windows中的一个绘图实用程序)这样的应用中去,或者可以使用主程序组中的clipboard实用程序,将它作为一个CLP文件存起来。 图像的编辑 在处理位图图像时,图像编辑程序有许多创造性的功能。例如,把两幅照片天衣无缝地合成在一起。此外,图像编辑工具可以使图像改变和变形。例如,一张彩色照片上的一朵红玫瑰可以变成一朵紫玫瑰,也可以把它变成自然界中难以见到的或根本见不到的蓝色或

31、黑色的玫瑰,也可以改变它的形状。变形可以用来管理静态图像,或者创造一种有趣的、十分不寻常的、有生气的图形变形,从而产生另外一种特殊的效果。它允许人们把两个图像平滑地融合在一起,看起来就好像是一个图像融入了另一个图像中一样。例如,通过计算机一定算法的处理,它可以把熟知的一个人物,不知不觉地逐渐地变成了另一个熟悉的人物。(4)图像的压缩由于图像的数据量很大,需经过压缩后再进行存储和传输。因此,研究压缩算法是非常重要的。如果采用无损压缩,压缩比不会太高。采用有损压缩,则可能对图像的质量有影响,通常采用一种折中的方案。在图像压缩中,要考虑实时性问题,压缩和解压缩都需要时间,为了减少压缩时间,通常采用硬

32、件来完成,这样可以缩短由压缩和解压缩带来的延迟。(5)图像的优化 如果原始采集的图像质量不好或者由于外界噪声影响而产生杂色、杂斑等,就应该采用图像优化技术。通过对图像的增强、噪声过滤、畸变校正、亮度调整和色度调整等,可获得满意的图像。2 矢量图形图形是一种抽象化的图像,是把图像按某个标准进行分析而产生的结果。它不直接描述数据的每一点,而是描述产生这些点的过程和方法。通常,将图形称为矢量图形。矢量图形是用一个指令集和来描述的。这些指令用来描述构成一幅图的直线、矩形、圆、圆弧、曲线等的形状、位置、颜色等各种属性和参数。显示时,需要相应的软件读取和解释这些指令,并将其转变为屏幕上所显示的形状和颜色。

33、由于大多数情况下,不用对图像上的每一点进行量化保存,因此需要的存储量较小。产生矢量图形的程序通常称为绘图程序,它可以分别产生和操作矢量图形和各个片段,并可任意移动、缩小、放大、旋转和扭曲各个部分,即使相互覆盖或重叠,也依然保存各自的特性。矢量图形主要用于线形的图画、美术字、工程制图等。但是,对于一个复杂的图像,用矢量图形的格式表示,需要花费计算机大量的时间。通常可以用矢量图形方式创建一幅复杂的图形,再在应用程序的使用中将其转化为位图格式的图像。把矢量图构成的图形变换成位图的方法很简单。只要在保存图形时,把矢量图变换成位图就可以了。但把位图变换成矢量图则比较困难。但是,也有许多实用程序,可以检测

34、位图图像中物体的边界,然后得出描述该物体的多边形对象。这一过程叫做“自动跟踪”,在某些集成了位图和矢量图像的创作系统(如SuperCard)中就提供这种功能。大多数多媒体著作系统都提供了若干矢量图对象供用户使用,这些矢量图对象有直线、矩形、椭圆、多边形以及正文等。矢量图有许多用处。例如,计算机辅助设计系统中常用矢量图对象系统来创造一些十分复杂的几何图形和三维动画。矢量是用其两个端点位置来描述的一条直线。例如,一个矩形可以简单地定义如下:Rect, 0, 0, 200, 200将画出一个正方形,它先从荧光屏的左上角开始,水平走200个像素,再往下走200个像素,最后画成一个正方形。对于下面的描述

35、:Rect, 0, 0, 200, 200, Red, Blue将画出一个同样的正方形,只不过其边框线是红色,方框中是蓝色。对于下述描述: Circle, x, y, r表明画一个圆,圆心用x和y指明,圆的大小用r表示。上述的解释结果,完全由软件设计时所制订的语法规则所确定。3。矢量图与位图的比较(1)空间在上述对一个彩色正方形的描述中,所用的数字和字母仅用了不到30B。如果经过压缩,所用的字节数还要少。另一方面,对于同样的一个正方形,若用未经压缩的位图,对黑白图像而言(每个像素仅有1b颜色深度),将占用5000B(200200/8),其中,数字8表示1B有8b;对256色的图像而言(每个像素

36、有8b颜色深度),则将要求40KB(200200/8)8)。(2)性能当在荧光屏上画了许多对象时,由于每个对象的大小、位置和其他特性都需要计算,等待荧光屏的刷新就需要很长的时间,速度变慢。例如,由500个单独的直线和矩形构成的图像就比仅由处理几个对象组成的图像用的时间长很多。这就是说,对于复杂的图像,用位图比用矢量图画对象的刷新速度快。4监视器与颜色 目前,大多数的多媒体图像都展示在横向640个像素,纵向480个像素(640480)的彩色监视器上。通常每英寸约有72点或像素,每个像素可以有256种颜色。在颜色较少的情况下,就不能产生像真实照片那样好的图像。颜色较多时,为了把较好的图像显示在荧光

37、屏上,对计算机的要求就很高,这时,要求使用较快的、比较昂贵的处理器,并扩充内存的容量。 256种颜色(8b)的设置通常称为VGA(Video Graphics Array),对大多数Windows和Macintosh的多媒体系统来说,它是一种默认的配置。虽然Windows的确支持16种颜色(4b),但为了得到较好的多媒体效果,在计算机上至少要配置256色的VGA图形适配器和VGA监视器。(1)监视器分辨率监视器的分辨率有3种: 屏幕分辨率屏幕分辨率是指监视器整个显示屏分辨率。通常用640480表示屏幕分辨率(VGA标准)。其中,640指的是在每一条水平扫描线上显示640个点(即像素),换句话说

38、,每一条水平扫描线是由640个点构成的虚线;480指的是一幅屏上总共有480条水平扫描线。 图像分辨率屏幕分辨率确定了“播放场”的大小,而图像分辨率表明图像要用多大一块播放场。例如,320240的图像仅占整个屏幕的1/4,比640480大的图像就不可能在屏上完整地看到。 像素分辨率在每一个屏幕上的像素没有必要具有同样的大小或形状。把用长宽比为1:1的像素创建的图像,放到像素长宽比为1:2的屏幕上将出现严重的失真。但这种类型的失真已较少见,因为现代的显示技术已差不多把像素的长宽比1:1定成了标准。(2)颜色颜色是多媒体的重要组成部分。人的眼睛对红、绿、蓝颜色敏感,通过调节这3种颜色的组合成分使人

39、的眼睛和大脑感受到各种颜色。这种颜色是心理上的,而不是物理上的颜色。例如,在计算机荧光屏上感受到的橙色,实际上是红光和绿光两种频率的复合,而不是在阳光下看到的实际水果橙子中频谱真实的频率。这些因素使计算机的颜色处理起来非常复杂。 红、绿、蓝通常称为RGB(Red、Green、Blue),它们的不同组合使人们可以感受各种颜色,如表3-2所示即为这种情况。监视器上像素的颜色常常用红色、绿色、蓝色的总量来表示。在计算机中用来确定颜色的模型有RGB、HSB、HSL、CMYK、CIE等。使用RGB时,是通过在065535的数值范围内设定红、绿、蓝的数值来确定颜色。表3-3显示使用的RGB的情况。在HSB

40、(Hue灰色、Saturation饱和度、Brightness亮度)和HSL(Hue、Saturation、Lightness亮度)模型中,确定色度或颜色是在颜色轮上从03600的角度,以及饱和度和亮度的百分数来表示的。亮度是与颜色混合的黑或白的百分数。百分之百的亮度将产生白色,0产生黑色,纯颜色具有50%的亮度。饱和度是颜色的浓度。在100%的饱和度下,颜色是纯色;在0饱和度下,颜色是白色、黑色或灰色。表3-4表示了颜色轮上各个颜色所在的位置(角度)。表3-2 RGB组合与感知的颜色之间的关系RGB组合 感知的颜色 RGB组合 感知的颜色 仅有红色 红色 红与蓝(减去绿) 紫色仅有绿色 绿色

41、 绿与蓝(减去红) 青色 仅有蓝色 蓝色 红、绿、蓝 白色 红与绿(减去蓝) 黄色 红、绿、蓝均无 黑色表3-3 RGB的数值与颜色的对应关系红 绿 蓝 颜色 65535 65535 65535 白色 65535 65535 0 黄色65535 0 65535 紫色0 65535 65535 青色65535 0 0 红色0 65535 0 绿色0 0 65535 蓝色0 0 0 黑色(3)图像文件的格式Windows使用设备无关位图(Device Independent Bitmaps,DIB)作为其通用的图像文件格式。DIB可以是独立的,也可以隐藏在一个叫做资源交换文件格式(Resource

42、 Interchange File Format,RIFF)的文件中。在Windows中,RIFF实际上是所有多媒体开发中人们比较喜欢使用的文件类型,因为这一文件包含了许多种文件类型,如位图、MIDI乐谱及格式化的正文等。Windows中最常用的图像文件格式是DIB、BMP、PCX和TIFF。BMP文件是Windows的位图文件。PCX文件原来是在Z-soft MS-DOS的绘图软件包中用的。TIFF(Tagged Interchange File Format)是按通用位图图像格式设计的,也广泛用于桌面出版软件包中。表3-5示出了在Windows环境中可能用到的图像文件格式。这些格式之间可以

43、用实用程序CONVERT来进行相互转换的。在安装该实用程序时,要加上Windows的多媒体扩展名。表3- 在颜色轮上颜色与角度的对应关系颜色角度(0)颜色角度(0)红0青180黄60 蓝 240 绿120紫300表3-5 图像文件格式格式扩展名Microsoft Windows DIB BMP、DIB和RLE Microsoft RLE DIB DIB Microsoft Palettee RAL Microsoft RIFF DIB RDI Computer Graphics Metafile CGM Microgrfx Designer/Draw DRW AutoCAD Format 2-d DXF Initial Graphics Exchange Standard IGS Encapsulated PostScript EPS CompuServe GIF G

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号