《多媒基础知识(软件设计师).ppt》由会员分享,可在线阅读,更多相关《多媒基础知识(软件设计师).ppt(100页珍藏版)》请在三一办公上搜索。
1、多媒体基础知识,软件设计师课程讲义,教学要求,掌握多媒体信息处理基础知识多媒体技术的概念;多媒体应用中的媒体元素 多媒体信息处理的关键技术 多媒体计算机系统的组成多媒体计算机的硬件系统多媒体计算机的软件系统,主要内容:,多媒体信息处理基础知识,6.1,多媒体计算机系统的组成,6.2,多媒体基础知识,6.1多媒体信息处理基础知识,多媒体(Multimedia)技术是集文字、声音、图形、图像、视像和计算机技术于一体的综合技术。一、多媒体技术的概念(一)媒体及其分类媒体是信息标识和传输的载体。媒体在计算机领域可分为以下五类(国际电报电话咨询委员会(CCITT)对媒体的分类)。感觉媒体(Percept
2、ion Medium)感觉媒体是直接作用于感知器官的,能直接感觉的媒体,如人类的各种语言,各种声音、音乐、图形、图像、视像、文字等等。,表示媒体(Representation Medium)表示媒体是为了加工、处理和传输感觉媒体而人为构造出来的一类媒体。它是将感觉媒体数字化,主要指各种编码,如语言编码、文本编码、图像编码等。表现媒体(Presentation Medium)表现媒体是感觉媒体与计算机之间的界面,如键盘、摄像机、话筒、显示器、打印机等。,存储媒体(Storage Medium)存储媒体用于存储表示媒体,及存储感觉媒体数字化之后的代码。常用的存储媒体有磁盘、磁带、光盘和半导体存储器
3、等。传输媒体(Transmission Medium)传输媒体是用来传送媒体的物理载体,如双绞电缆、同轴电缆、光纤电缆、微波、红外线、卫星信道等。,(二)多媒体及其主要特征多媒体系统强调以下三大特征:集成性、交互性和数字化特征。集成性是指可对文字、图形、图像、声音、视像、动画等信息媒体进行综合处理,达到各种媒体的协调一致。交互性是指人能方便地与系统进行交流,以便对系统的多媒体处理功能进行控制。数字化特性是指各种媒体的信息,都以数字形式(即转换为“0”和“1”的方式)进行存储、处理和传输,而不是传统的模拟信号方式。,“虚拟现实”(virtual reality,简称vr)是用计算机技术来生成一个
4、逼真的三维视觉、听觉、触觉或嗅觉等感觉世界,让用户可以从自己的视点出发,利用自然的技能和某些设备对这一生成的虚拟世界客体进行浏览和交互考察。它可使用户获得与真实世界一样的感觉,可达到代替实际系统的目的.,(三)虚拟现实,专业级虚拟现实系统具有高度的实时性,能同时使用多种输入输出设备,用户可以用人体的自然技能,借助数字头盔、立体显示技术、数据手套和数据衣服等工具,与虚拟的感觉世界进行交互作用。,现在虚拟现实的范围很广,包括虚拟环境、塞伯空间等。虚拟现实最重要的目标就是真实的体验和方便自然的人机交互,凡是能够达到或部分达到这样目标的系统就称为虚拟现实系统。,虚拟现实的基本特征,虚拟现实系统的关键特
5、性,沉浸:“真实”的体验,交互:实时操纵 得到反馈信息,多感知:具有人所有的感觉,1桌面虚拟现实2沉浸式虚拟现实3增强现实系统4分布式虚拟现实,虚拟现实类型,1桌面虚拟现实,利用个人计算机和低级工作站进行仿真,将计算机的屏幕作为用户观察虚拟境界的一个窗口。使用简单的外部设备,(如鼠标、轨迹球)来观察360度范围内的虚拟世界,并操纵虚拟场景中的各种物体。纯软件型,2沉浸式虚拟现实,高级虚拟现实系统,提供完全沉浸的体验,使用户有一种置身于虚拟境界之中的感觉。,利用头盔式显示器或其他硬件设备数据手套位置跟踪器,3增强现实系统,不仅是利用虚拟现实技术来模拟现实世界、仿真现实世界,而且要利用它来增强参与
6、者对真实环境的感受。增强现实中无法感知或不方便的感受。,真实环境和虚拟环境结合起来的系统,部分系统是真实环境,这样既可减少真实环境的资源消耗,又可对实际物体进行操作。,4分布式虚拟现实,如果多个用户通过计算机网络连接在一起,同时参加一个虚拟空间,共同体验虚拟经历,那虚拟现实则提升到了一个更高的境界,这就是分布式虚拟现实系统。,(四)音频,基 本 概 念,声音是多媒体表现形式中不可缺少的一部分,它使多媒体的表现力更加丰富。声音主要包括语言、背景声、音效和音乐4个部分。语言 背景声 音效 音乐,声音的概念,空气中的分子在某些介质的作用下振动,形成声音,其振动过程可用一连续的曲线表示,称为声波。,振
7、幅,周期,曲线上的任一点再次出现所需时间间隔称为周期。而一秒钟内声音由高(压力强)到低(压力低)再到高(压力强),这个循环出现的次数称为频率。,声音频率:,声音的三要素为音调、音强、音色。音调与声音的频率有关,频率快则音调高,频率慢则音调低。音强又称响度,取决于声音的幅度,即振幅的大小和强弱。音色指音的感觉特性。不同的物体发出的声音我们可以通过音色分辨,不同发生体的材料、结构不同,发出声音的音色也就不同。根据不同的音色,即使在同一音高和同一声音强度的情况下,也能区分出是不同乐器或人声发出的。,声音的三要素,声音频率:,声音按频率可分为3种:次声波、可听声波和超声波。人类听觉的声音频率范围为20
8、Hz20kHz,低于20Hz的为次声波,高于20kHz的为超声波。人说话的声音信号频率通常为300Hz3kHz,人们把在这种频率范围内的信号称为语音信号。,声音频率:,声音质量用声音信号的频率范围来衡量,频率范围又叫“频域”或“频带”,不同种类的声源其频带也不同。声源的频带越宽,表现力越好,层次越丰富。电话质量:200Hz3.4kHz。调幅广播质量:50Hz7kHz。调频广播质量:20Hz15kHz。数字激光唱盘(CD-DA)质量:10Hz20kHz,声音的数字化,把模拟声音信号转换为数字声音信号的过程称为声音的数字化,它是通过对声音信号进行采样、量化和编码来实现的。,1采样,把模拟声音变成数
9、字声音时,需要每隔一个时间间隔在模拟声音波形上取一个幅度值,称为采样,即A/D(模/数)转换。目前最常用的采样频率有3种:44.1kHz、22.5kHz、11.025kHz。,2量化,把某一幅度范围内的电压用一个数字来表示称为量化,量化的过程实际上也是选择分辨率的过程。标准的语音编码采用8bit(位),即可有28=256个量化级。音频量化的位数通常采用 16 位,其对应有216=65536个量化级。,量化位数8 bit采样频率11 KHz,量化位数16 bit采样频率22 KHz,3.编码,由于计算机内数据的存储采用的是二进制,为此必须将声音数据写成计算机的数据格式,称为编码。所以,数字声音是
10、一个数据序列,它是由模拟声音经过采样、量化和编码后得到的。,声音文件的大小,数据量=采样频率量化位数录音时间声道数/8数据量的单位为B/s(字节/秒)。例如,一首5分钟CD音乐光盘音质的歌曲,即采样频率 44.1kHz,量化位数16位,立体声音频文件的大小为:(44100163002)/8=52920000B=50.47MB,声音合成,由计算机合成的声音 语音合成 音乐合成,语音合成,语音合成,又称文语转换(Text to Speech)技术,能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴。我们所说的“让机器像人一样开口说话”与传统的声音回放设备(系统)有着本质的
11、区别。传统的声音回放设备(系统),如磁带录音机,是通过预先录制声音然后回放来实现“让机器说话”的。这种方式无论是在内容、存储、传输或者方便性、及时性等方面都存在很大的限制。而通过计算机语音合成则可以在任何时候将任意文本转换成具有高自然度的语音,从而真正实现让机器“像人一样开口说话”。,文语转换系统,语音合成技术分类,波形编辑合成参数分析合成声道模型参数合成,音乐合成技术,调频(FM)合成,是将多个频率的简单声音合成复合音来模拟各种乐器的声音。FM合成方式是早期使用的方法,用这种方法产生的声音音色少、音质差。波形表(WaveTable)合成这种方法是先把各种真正乐器的声音录下来,再进行数字化处理
12、形成波形数据,然后将各种波形数据存储在只读存储器中。发音时通过查表找到所选乐器的波形数据,再经过调制、滤波、再合成等处理形成立体声送去发音。存储声音样本的ROM容量的大小对波表合成效果影响很大。,二、多媒体应用中的媒体元素(一)文本(Text)文本是指各种文字,包括各种字体、尺寸、格式及色彩的文字。文本是计算机文字处理的基础,也是多媒体应用程序的基础。通过对文本显示方式的组织,多媒体应用系统可以使显示的信息形式多样化、更易于理解。文本的多样化主要是通过文字的属性,如格式(style)、对齐方式(align)、字体(font)、大小(size)、颜色(color)以及它们的各种组合而表现出来的。
13、,MIDI,MIDI(musicalinstrumentdigitalinterface)是数字乐器接口的国际标准,它定义了电子音乐设备与计算机的通讯接口,规定了使用数字编码来描述音乐乐谱的规范。常见的MIDI设备有电子琴等。计算机中以MID为扩展名的文件称为MIDI文件,其中存放的是对MIDI设备的命令,即每个音符的频率、音量、通道号等指示信息。最后播出的声音是由MIDI设备根据这些信息产生的。MIDI声音可以用于配音,它的缺点是对回放设备的依赖太强,还有就是不能记录人声,(五)图形和图像图形:一般是指计算机绘制的画面,如直线、园、圆弧、矩形、任意曲线和图表等。图像:指由输入设备捕捉的实际场
14、景画面或以数字化形式存储的画面。图像的细化分类:模拟图像是固定在图层上的画面。如一张照片,就是通过化学摄影术而制成的一幅静态的画面,它一旦形成就很难再改变。数字图像是以0或1的二进制数据表示的,其优点是便于修改、易于复制和保存。数字图像可以分为以下2种形式:矢量图和位图,实践一:根据生活经验讨论传统相机拍摄的照片与数码相机拍的照片各有什么特点?,相对困难,较易,差,强,较快,较差,图像数字化的缺点:1、经过数字化的图像会有所损失和失真;2、数字化后的文件不能直接观看,必须借助播放设备才可观看;3、由于采用二进制形式的存储方法,数据量巨大,一般包括三个阶段:采样、量化和编码,采样,量化,编码,多
15、媒体信息,输入,数字化的多媒体信息,输出,采样:就是按照一定的规律每隔一定时间间隔抽取模拟信号的值。量化:就是对样本值进行离散化处理,即事先规定一组数据,每个数据按一定规则近似表示一组相关采样值。编码:经过量化后得到的数字信息,还必须按一定格式转换成计算机可以识别的二进制形式,才能在计算机中保存。用二进制形式表示量化值的过程称为编码。,图形、图像数字化原理,图形、图像的数字化:将模拟图像转化为数字图像的过程。,看上去一个“像素”就是一个正方形的色块,事实上,“像素”是一个纯理论的概念,它没有形状也没有尺寸,看不见摸不着,只存在于理论计算中。,图形、图像数字化原理,每一个方块(可看成一个点)称为
16、像素,每英寸的像素点数称为分辨率,2、实物图像被分割成一个一个的颜色方块,发现:,1、图像是由很小的颜色方块组成的,常用的四种分辨率:输入分辨率、显示分辨率、输出分辨率、图像分辨率,采样过程要涉及的两个重要参数:,分辨率、色彩深度,(1)、分辨率,采样时,首先要决定在一定的面积内取多少个点,或者叫多少个像素,它决定了图像的清晰度,其衡量指标就是分辨率。,图像分辨率是指以像素数表示数字图像的总信息量。,例如:72dpi分辨率的1英寸X1英寸图像包含总共5184像素;300dpi分辨率的1英寸X1英寸图像包含总共90000像素,色彩深度,指记录每个像素的颜色(或亮度)所占的二进制位数,单位是“位/
17、像素”,即b/p。对于彩色图像来说,色彩深度决定了该图像可以使用的最多颜色数目;色彩深度越高,显示的图像色彩越丰富,画面越自然、逼真,但数据量也随之猛增。,较大的色彩深度(每像素信息的位数更多)意味着数字图像具有较多的可用颜色和较精确的颜色表示。例如,色彩深度为 1 的像素有两个可能的值:黑色和白色,而色彩深度为 8 的像素有 256 个可能的值。色彩深度为 24 的像素有 大约 1,600 万个可能的值。常用的位深度值范围为 1 到 64 位/像素。,在不同的领域,人们采用的色彩深度往往不同,比如,从事艺术绘画的画家们习惯用HSB(色调、饱和度和亮度)模型;显示器这类发光物体用RGB模型;打
18、印机这类吸光物体的CMYK模型;电视系统用YUV模型等。这只是几种经常使用的色彩模型,它们均有各自的特点。Photoshop 也可以处理每个颜色通道包含 16 位数据的 Lab、RGB、CMYK、多通道和灰度图像。此外,Photoshop 还可以处理每个颜色通道包含 32 位数据的 RGB 和灰度图像(高动态范围 HDR 图像)。,常见的色彩深度,4bit:是VGA标准支持的色彩深度,共24种颜色。8bit:是多媒体应用中的最低色彩深度,共28种颜色,是索引彩色图。24bit:用三个字节分别表示RGB,即8bit表示一个通道,可生成224=16777216种颜色,真彩色。32bit:同24位的
19、颜色深度一样,剩余的8bit用来表示图像的其他属性,如透明度,即alpha通道等。,实践二:分别设置显示器分辨率(640*480、800*600、1024*768)后,把素材中“桌面.jpg”文件设置成桌面,观看效果并讨论影响图像的显示效果的因素。,小结:分辨率:指在单位面积中采集的样点数。它的基本作用就是用来说明数字图像信息的数量和密度。也就是说,分辨率越高,采样的点数就越多,图像的像素就越大,图像也就越清晰。,分辨率与数字化图形、图像的效果,1:一幅图像的分辨率为256512,计算机的屏幕分辨率是1024768,该图像按100%显示时,占据屏幕的()。A、1/2 B、1/6 C、1/3 D
20、、1/10 2:要打印出清晰的图片,在进行图像处理时就要重点关注图片的()。A、图像分辨率 B、显示分辨率 C、输出分辨率 D、上述三项,练 习 题,位图是以点或象素的方式来记录图像的,因此图像是由许许多多小点组成的。创建一幅位图图像的最常用方法是通过扫描来获得。位图图像的优点是色彩显示自然、柔和、逼真。其缺点是图像在放大或缩小的转换过程中会产生失真,且随着图像精度提高或尺寸增大,所占用的磁盘空间也急剧增大。矢量图是以数学方式来记录图像的,由软件制作而成。矢量图的优点是信息存储量小,分辨率完全独立,在图像的尺寸放大或缩小过程中图像的质量不会受到丝毫影响,而且它是面向对象的,每一个对象都可以任意
21、移动、调整大小或重叠,所以很多3D软件都使用矢量图。矢量图的缺点是用数学方程式来描述图像,运算比较复杂,而且所制作出的图像色彩显示比较单调,图像看上去比较生硬,不够柔和逼真。,静止图像在计算机中难以用矢量来表示,基本上只能用点阵来表示,其元素代表空间的一个点,称之为像素(pixel),这种图像也称位图。位图中的位(bit)用来定义图像中每个像素点的颜色和亮度。对于黑白图像常用1个二进制的位来表示;对灰度图像常用4个二进制的位(16种灰度等级)或8个二进制的位(256种灰度等级)表示该点的亮度;,位图图像与矢量图形区别,图形图像的格式,BMP:最典型的应用BMP格式的程序就是Windows的画笔
22、。BMP是用于Windows和OS/2的位图(Bitmap)格式,文件几乎不压缩,占用磁盘空间较大,它的颜色存储格式有1位、4位、8位及24位。开发Windows环境下的软件时,BMP格式是最不容易出问题的格式,并且DOS与Windows环境下的图像处理软件都支持该格式,因此,该格式是当今应用比较广泛的一种格式。但缺点是该格式文件比较大,所以只能应用在单机上,不受网络欢迎。,GIF格式 是非常普遍的图像格式,适合在网上传输交换。GIF文件格式采用了LZW压缩算法来存储图像数据,GIF文件允许用户为图像设置背景的透明属性。此外,GIF文件格式可在一个文件中存放多幅彩色图形/图像。如果在GIF文件
23、中存放有多幅图,它们可以像演幻灯片那样显示或者像动画那样演示。,PCX格式 PCX格式是ZSOFT公司在开发图像处理软件Paintbrush时开发的一种格式,基于PC的绘图程序的专用格式,一般的桌面排版、图形艺术和视频捕获软件都支持这种格式。PCX支持256色调色板或全24位的RGB,图像大小最多达64K*64K像素。,TIFF格式TIFF格式(Tag Image File Format)是Macintosh上广泛使用的图形格式,具有图形格式复杂、存贮信息多的特点。3DS、3DS MAX中的大量贴图就是TIFF格式的。TIFF最大色深为32bit,可采用LZW无损压缩方案存储。,JPEG格 J
24、PEG文件的扩展名为.jpg或.jpeg,其压缩技术十分先进,它用有损压缩方式去除冗余的图像和彩色数据,获取得极高的压缩率的同时能展现十分丰富生动的图像,由于它优异的性能,所以应用非常广泛,而在Internet上,它更是主流图形格式,PSD格式ADOBE公司开发的图像处理软件PHOTOSHOP中自建的标准文件格式就是PSD格式,在该软件所支持的各种格式中,其存取速度比其它格式快很多,功能也很强大。由于PHOTOSHOP软件越来越广泛地应用,所以这个格式也逐步流行起来。PSD格式是Photoshop的专用格式,里面可以存放图层、通道、遮罩等多种设计草稿。以便于下次打开文件可以修改上一次的设计。,
25、PNG格式 PNG(Portable Network Graphics)是一种新兴的网络图形格式,结合了GIF和JPEG的优点,具有存贮形式丰富的特点。PNG最大色深为48bit,采用无损压缩方案存储。著名的Macromedia公司的Fireworks的默认格式就是PNG。,图形、图像文件的压缩,数据压缩:对数据重新进行编码,以消除数据序列中的冗余性,实现原数据序列变换成较短的输出数据序列(又称压缩数据序列)的技术。,压缩比:压缩数据序列与原数据序列长度之比。,图像文件大小图像文件的大小用字节数来表示,其描述方法为:(水平像素数垂直像素数灰度位数)/8。而一张3英寸5英寸的彩色相片,经扫描仪扫
26、描进入计算机中成为数字图像,若扫描分辨率达1200DPI(点/英寸),则数字图像文件的大小为:5120031200248=64800000B62MB,无损压缩:是指利用信息相关性进行的数据压缩,这种压缩并不损失原有信息的内容,是一种可逆压缩,即经过文件压缩后可以将原有的信息完整保留的一种数据压缩方式,范围:文档、可执行文件等普通的数据文件。,有损压缩:是利用了人类视觉和听觉器官对图像或声音中某些部分不敏感的特性,采用一些高效的有限失真数据压缩算法,大幅度减少多媒体中的冗余信息,它允许在压缩过程中损失一定信息,即压缩后不能将原来的文件信息完全保留,所以是不可逆压缩。,范围:图像、音频、视频等多媒
27、体文件。,变换部分:体现了输入原始图像和经过变换的图像之间的一一对应关系。变换也称为去除相关,它减少了图像中的冗余信息,提供了一种更易于压缩的图像数据表示形式。,量化部分:把经过变换的图像数据作为输入进行处理后,会得到有限数目的一些符号。这一部会带来信息的损失,是有损压缩与无损压缩的主要区别。,编码部分:将经过变换的数据编码为二进制位流,可以采用固定长度编码或变动长度编码。,图像压缩的基本过程:,数据压缩和编码技术标准,H.261H.261是用于音频视频服务的视频编码解码器,也称为P64标准。由CCITT(ITU-T)制定。其应用目标是可视电话和视频会议系统。含有此标准的系统必须能实时的按标准
28、进行编码和解码。H.261于JPEG、MPEG标准的区别在于它是为动态使用而设计的,并提供完全包含的组织的高水平的交互控制。JPEGJPEG是静止图像压缩和解压缩算法的标准,它是基于DCT的有损算法,是ISO的国际标准。MPEG在三方面优于其他的压缩/解压方案:开始就是一个国际化的标准,兼容性很好;比其他算法有更高的压缩比,最高可达到200:1;在提供高压缩比的同时,对数据的损失很小;,MPEGMPEG-X是一组由ITU和ISO制定发布的视频、音频和数据的压缩标准。MPEG-1制定于1992年,传输率最高可达4Mbps5Mbps,质量级别与VHS相当。可用于记录媒体或是在Internet上传输
29、音频。MPEG-2制定于1994年,传输率在3Mbps10Mbps之间,DVD指定标准。MPEG-4传输率要求在4800bps64000bps之间。其主要特点是交互性和综合性。更适合交互AV服务记忆即远程监控,是第一个使观众由被动变主动的动态图象标准。DVIDVI视频图像压缩算法的性能与MPEG相当,图像质量可达到VHS的水平。压缩以后的图像传输率约为1.5Mbps。,(六)视频(Video)视频图像(video)是一种活动影像,是利用人眼的视觉暂留现象,将足够的画面(frame,帧)连续播放,只要能够达到每秒20帧以上,人的眼睛就察觉不出画面之间的不连续性。电影是以每秒24帧的速度播放,而电
30、视则依视频标准的不同,播放速度有25帧/秒(中国用PAL制)和30帧/秒(北美用NTSCM制)之分,法国和中东一带用SECAM制。活动影像如果帧率在15帧/秒之下,则将产生明显的闪烁甚至停顿;相反,若提高50帧/秒甚至100帧/秒,则感觉到图像极为稳定。,视频影像文件的格式在PC中主要有三种:.AVI:AVI(audio video interleaved 声音/影像交错),Windows所使用的动态图像格式,不需要特殊的设备就可以将声音和影像同步播出。这种格式的数据量较大。,.MPG:MPG是MPEG(Motion Photographic Experts Group,活动图像专家组)制定出
31、来的压缩标准所确定的文件格式,供动画和视频影像用。这种格式数据量较小。,.ASF:ASF是微软公司采用的流式媒体播放的格式(advanced stream format),比较适合在网络上进行连续的视像播放。,视频图像输入计算机是通过摄像机、录像机或电视机等视频设备的AV输出信号,送至PC机内视频图像捕捉卡进行数字化而实现的。数字化后的图像通常以.AVI格式储存,如果图像卡具有MPEG压缩功能,或用软件对.AVI进行压缩,则以.MPG格式储存。新型数字化摄像机可直接得到数字化图像,则不再需要通过视频捕捉卡,而直接通过PC 的并行口、SCSI口或USB口等数字接口,输入给计算机。,(七)动画动画
32、也是一种活动影像,最典型的是“卡通”片。它与视频影像不同的是:视频影像一般是指生活上所发生的事件的记录,而动画通常指人工创作出来的连续图形所组合成的动态影像。,(八)超文本(HyperText)超文本是一种非线性的信息组织与表达方式,超文本所建立的连接,往往是网状连接。Internet的WWW(World Wide Web)网页使用了一种超媒体的文件格式,称为“超文本标记语言”HTML(Hyper Text Markup Language),该文件具有规定的扩展名html或htm。,三、多媒体信息处理的关键技术(一)数据压缩技术数据压缩算法可分为无损压缩和有损压缩两种:无损压缩无损压缩用于要求
33、重构的信号与原始信号完全相同的场合。有损压缩有损压缩适用于重构信号不一定非要与原始信号完全相同的场合。,目前应用于计算机的多媒体压缩算法标准有如下两种:压缩静止图像的JPEG标准这是由联合图像专家组(Join Photographic Expert Group,JPEG)制定的静态数字图像数据压缩编码标准。压缩运动图像的MPEG标准这是由活动图像专家组(Motion Photographic Expert Group,MPEG)制定的用于视频影像和高保真声音的数据压缩标准。,6.2多媒体计算机硬件,一、多媒体主机多媒体主机通常由主机板、CPU、内存、软盘驱动器、硬盘驱动器、光盘驱动器等组成。由
34、于多媒体计算机系统需要交互式地综合处理文字、声音、图形、图像、动画等大信息量的媒体,因此,多媒体计算机的主机系统要求中央处理器的速度快、存储器的容量大、输入输出接口及系统总线速度尽可能快。,二、多媒体卡(一)声卡声卡(是多媒体计算机的标准配件之一,是实现声波数字信号相互转换的硬件电路。其主要功能是录制和播放数字声音,编辑合成MIDI音乐等。,(1)声卡的工作原理声卡从话筒中获取声音模拟信号,通过模数转换器(ADC),将声波振幅信号采样转换成数字信号,进行处理后,存储到计算机中。当播放声音时,将数字信号送到数模转换器(DAC),还原为模拟波形,放大后输出。(2)声卡的主要性能指标采样频率量化精度
35、:声道数:声道数即为声音通道的个数。,(二)视频卡视频卡就是多媒体计算机系统中用于对视频进行采集、处理、播放的部件。视频卡按功能的不同可以分为视频采集卡、电视编码卡、电视接收卡、MPEG解压卡、DVD解压卡。,(1)视频采集卡视频采集卡用来把摄像头、录像机、激光视盘中的视频信号转换为数字信号,把视频图像以数字的形式采集到计算机的存储设备中。,(2)电视编码卡电视编码卡可将计算机显示器上的信号转换成标准电视视频信号,这样就可以利用电视来显示计算机显示器上的画面。(3)视频监控卡一般是对摄像头或者摄像机等信号进行捕捉,并以MPEG格式存储在硬盘上的PCI插槽的卡。,(4)DV卡也叫1394卡,目前
36、市场上有两种1394(DV)卡,一种是1394A,一种是1394B,1394A的传输速率为400MB/S,1394B的传输速率为800MB/S。1394采集卡插入PC的PCI插槽里,数码摄像机与它相连,就可以把DV影片复制制(采集)到PC的硬盘里(或是从硬盘把信号传输到摄像机)。,三、多媒体输入设备扫描仪、数字相机等;视频输入设备,如摄像机、录像机等。(一)扫描仪扫描仪是将照片、文字或图片获取下来,以图片文件的形式保存在计算机中的一种设备。,(1)扫描仪的分类按工作原理可将扫描仪分为平板式扫描仪、手持式扫描仪和滚筒式扫描仪。目前常用的是平板式扫描仪。按可扫描幅面的大小可以分为小幅面的手持式扫描
37、仪、中等幅面的台式扫描仪和大幅面的工程图扫描仪。按色彩方式可以将扫描仪分为单色扫描仪和彩色扫描仪。单色扫描仪又可分为黑白扫描仪和灰度扫描仪,一般的灰度扫描仪均可以兼容黑白扫描仪工作方式。,(2)扫描仪的组成和原理扫描仪主要由光电传感器、机电同步机构、数据传输电路三部分组成。扫描仪的原理是:将光学图像转送到光电转换器中变为模拟信号,然后模拟信号通过A/D转换器转换为数字信号,通过计算机接口送到计算机中。它的工作原理与传真机的工作原理相似。,(3)扫描仪的主要性能指标光学分辨率:分辨率越高,扫描出的图像也越清晰。一般来说,300DPI的分辨率基本能满足要求。色彩分辨率:表示色彩所用的二进制位数,单
38、位为Bit(位)。色彩位越高,所能表示的色彩数就越多,色彩也就越清晰。一般扫描仪的色彩分辨率都可以达到24位真彩色或更高。,(3)数码相机它是一种将图像以数字方式记录在存储器中的照相机。它的核心部件是CCD(电荷耦合元件)图像传感器,可将光线作用转化为电荷,再通过模数转换芯片转换成数字信号,经过压缩以后存储在内部存储器中。,(4)摄像机摄像机由摄像头、摄像管、同步电信号发生电路、放大电路组成。其原理是:被摄物体在摄像管上形成光学图像,经摄像管转换成电信号,以视频信号输出。,四、多媒体输出设备常用的多媒体输出设备除了显示器和打印机之外,音箱是多媒体计算机音频输出的重要设备。,五、多媒体计算机的软
39、件系统(一)多媒体操作系统系统软件中操作系统是多媒体计算机系统的核心,它除了具有一般操作系统的功能外,还具有管理多媒体硬件和多媒体数据的功能。Windows 2000是一个32位、多任务、具有强大多媒体功能的操作系统,因此是多媒体体计算机中广泛使用的操作系统。,(二)多媒体数据库系统多媒体数据库管理系统(MDBMS)指:处理文字、数值、声音、图像、视频等多种媒体信息的数据库管理系统。传统的数据库主要处理文字、数值等信息,却难以处理图像、声音、视频等数据,因此需要采用新的方法来管理多媒体数据。目前所采用的主要方法是在原有的基础上扩充数据库的功能。例如:目前大多数先进的关系数据库将二进制对象(BL
40、OB)作为新的数据类型,用于保存图像和其它的二进制数据。,(三)多媒体数据的采集和制作(1)多媒体音频数据的采集多媒体音频处理主要包括声音的录制、声音的编辑及声音的合成。波形声音的来源可以是:麦克风、录音机、电视等设备。MIDI音频的主要来源是外部的电子乐器,如:电子琴等。通过Windows的系统自带的“录音机”软件,可以完成波形声音的采集和简单的编辑。通过一些专业的声音编辑软件可以达到更好的效果。目前广泛使用的音频编辑软件有 Sound Forge、Cool Edit 等。,(2)多媒体图像、视频的采集和编辑图像的来源主要有:用工具软件绘制图像,通过扫描仪或数码相机获取图像。常用的编辑软件如
41、:Photoshop、CorelDraw等。视频的采集主要是通过视频卡,配以相应的编辑软件来完成。如:VidCap、VidEdit等。,(3)动画的制作常见的动画文件格式有:GIF格式,这种动画多用于网上;FLC格式的文件,由Animator Pro 软件制作;SWF是Flash动画格式,这种格式的动画存储空间小,广泛应用于网上;在众多的动画制作软件中3D Studio以其友好方便的界面、细腻的画面、出色的渲染等特色,为用户提供了具有专业水准的三维动画制作软件。3D Studio广泛应用于影视节目、广告制作、教学模拟演示以及多媒体应用系统开发等方面。,本讲小结,1.多媒体技术的概念(1)媒体及
42、其分类媒体是信息标识和传输的载体。媒体在计算机领域可分为以下五类。感觉媒体;表示媒体;表现媒体;存储媒体;传输媒体。(2)多媒体及其主要特征多媒体是指计算机领域中的感觉媒体,主要包括文字、声音、图形、图像、视像、动画等。多媒体系统强调以下三大特征:集成性、交互性和数字化特征。,2.多媒体应用中的媒体元素多媒体的媒体元素是指多媒体应用中可以展示给用户的媒体组成,目前主要包括文本、超文本、图形、图像、声音、动画和视像等媒体元素。3.多媒体信息处理的关键技术数据压缩技术、大容量光盘存储技术、多媒体网络技术、超大规模集成电路制造技术、多媒体数据库技术。,4.多媒体的应用 电子出版技术;多媒体数据库技术
43、;可视通信技术;网络多媒体技术;虚拟现实。5.多媒体计算机多媒体计算机(Multimedia Personal Computer,MPC)指能够处理多媒体信息的计算机。多媒体计算机系统由多媒体硬件系统和多媒体软件系统组成。,(1)多媒体计算机的硬件系统多媒体主机多媒体主机通常由主机板、CPU、内存、软盘驱动器、硬盘驱动器、光盘驱动器等组成。多媒体计算机要求中央处理器的速度快、存储器的容量大、输入输出口和系统总线速度尽可能快。,多媒体卡声卡;视频卡;多媒体输入设备;多媒体输出设备(2)多媒体计算机的软件系统系统软件主要包括:多媒体操作系统和各种多媒体硬件的驱动程序。应用软件主要包括多媒体的制作、开发和应用软件。,