大学计算机第五章.ppt

上传人:牧羊曲112 文档编号:6563686 上传时间:2023-11-13 格式:PPT 页数:59 大小:940KB
返回 下载 相关 举报
大学计算机第五章.ppt_第1页
第1页 / 共59页
大学计算机第五章.ppt_第2页
第2页 / 共59页
大学计算机第五章.ppt_第3页
第3页 / 共59页
大学计算机第五章.ppt_第4页
第4页 / 共59页
大学计算机第五章.ppt_第5页
第5页 / 共59页
点击查看更多>>
资源描述

《大学计算机第五章.ppt》由会员分享,可在线阅读,更多相关《大学计算机第五章.ppt(59页珍藏版)》请在三一办公上搜索。

1、1,多媒体基础,第五章,2,本章内容提要,一、多媒体技术的基本概念二、多媒体信息的数字化三、多媒体技术的应用,3,媒体(Media)在计算机中有两种含义:一是指存储信息的物理实体,如磁盘、光盘等;二是指信息的表现形式或载体。,多媒体(Multimedia)多媒体是多种媒体信息的载体,信息借助这些载体得以交流传播。使用的媒体包括文字、图象、声音、动画和电视图像(Video)等。,一、多媒体技术概述,4,多媒体技术,多媒体技术指利用计算机技术把多种媒体信息综合一体化,使它们建立起逻辑联系,并能进行加工处理的技术。,5,多样性媒体信息多样化集成性以计算机为中心,综合处理多种信息媒体交互性多媒体是人机

2、交互式媒体数字化 多媒体信息是以数字的形式而不是模拟信号的形式存储和传输实时性声音、视频等媒体与时间密切联系,好像面对面实时交互,多媒体技术的特征,6,多媒体采用如下几种媒体形式传递信息并呈现知识内容,图图形(Graphics)和静止图像(Still Video),文文本(Text),声声音(Audio),像动画(Animation)和运动图像(Motion Video)(视频),天空、白云、海洋、空气,7,多媒体信息处理的关键技术,多媒体数据压缩技术 多媒体数据存储技术 处理多媒体信息的集成电路制作技术 多媒体数据库技术 虚拟现实技术 多媒体网络与通信技术,返回目录,8,常见的媒体形式,文本

3、,动画,图像,音频,视频,二、多媒体信息的数字化,返回目录,图形,9,文本分为非格式化文本文件和格式化文本文件。非格式化文本文件:只有文本信息没有其他任何有关格式信息的文件,又称为纯文本文件,如.TXT 文件。格式化文本文件:带有各种文本排版信息等格式信息的文本文件,如.DOC文件。,文本(Text),返回本节目录,10,模拟音频的数字化 数字音频的技术指标 数字音频文件的存储格式,音频信息(Audio),返回本节目录,声音是多媒体信息的一个重要组成部分,人类从外部世界获取的信息中,10%是通过听觉获得的。因此,声音是多媒体技术研究中的一个重要内容。,11,声音是机械振动在弹性介质(如空气)中

4、传播的一种周期性的连续的波,称为声波。产生声波的物体为声源(如人的声带、乐器等),它的振动使周围气压发生高低变化,并以波的形式进行传播。声波传入到人耳,经过人类听觉系统的感知就是声音。,小常识,12,声音的频率范围,次声波,人耳可听域,超声波,20 Hz,20 20,000 Hz,20,000 Hz,人耳只能听到频率在2020 000Hz之间的声音,我们称之为音频信号。,13,声音是振动的机械波,话筒把机械振动转换成电信号,用随时间连续变化的物理量(电压)表示,称之为模拟音频。当它被数字化后,成为数字信号,以数字文件的形式被计算机接受和处理。我们实际上听不到数字音频信号。数字音频信号经过计算机

5、处理后,播放时,数字音频信号又被还原成为模拟音频,播放出来。,模拟音频与数字音频,14,完成数字音频回放过程主要硬件是数字到模拟的转换器D/A(Digital/Analog)或DAC(Digital to Analog Conversion),在多媒体系统中,最常用的声音转换装置是声卡,我们可以借助声卡中的模/数转换器(ADC)和数/模转换器(DAC)来实现模拟声音信号和数字声音信号的互相转换。,15,音频数字化的本质就是将连续的模拟声音信号,转换为时间与幅度都用离散数字表示的数字信号。音频数字化的过程就是利用模/数转换器(ADC)对模拟音频信号进行采样(Sampling)、量化(Quanti

6、zation)、编码(Coding),最终以文件形式存储到硬盘上。下图显示了音频数字化的三个步骤。,16,模拟音频的数字化,模拟信号与数字信号 在时间和幅度上都是连续的信号称为模拟信号 时间和幅度都用离散的数字表示的信号称为数字信号,在指定的时间范围内声音信号的幅值有无穷多个,采样得到的声音信号的幅值是无穷多个值中的一个,是离散的,17,用计算机对音频信息进行处理,要将模拟信号转换为数字信号,这个过程称为模拟音频的数字化。,模拟音频的数字化,采样,量化,编码,声音的模拟信号,声音的数字信号,模拟音频的数字化过程,18,采样是每隔一定时间间隔,对模拟波形取一个幅度值,把时间上的连续信号变成离散信

7、号。采样频率是每秒钟的采样次数,显然采样频率越高,数字化音频质量越好,音频文件越大。,采样,模拟音频的数字化,19,量化是将每个采样点得到的幅度值用数值存储 采样精度就是量化位数,即存储采样点幅度值的二进制位数。也就是将模拟信号分成多少个等级,量化精度越高,音乐的声压振幅越接近原音乐.在相同的采样频率下,量化位数越大,采样精度越高,数字化音频质量越好,音频文件越大。,模拟音频的数字化,量化,CD标准的量化精度是16Bit,DVD标准的量化精度是24Bit。,20,21,编码是将采样和量化后的数据按一定格式记录下来,编码的方式很多。程序附件娱乐录音机文件属性音频格式立即转换格式、属性,编码,模拟

8、音频的数字化,返回音频,22,数字音频的技术指标,数字音频的质量指标有三项:采样频率、量化位数(即采样精度)和声道数。声道数指声音通道的个数.声音到达两耳的相对时差和不同方向上感觉到的不同强度,就产生立体声效果。单声道记录一个波形,双声道记录两个波形,其存储空间是单声道的2倍。,实际采样中通常采取44.1kHZ作为高质量声音的采样标准(每秒采集声音样本44.1千次),23,计算存储声音容量的公式,采样频率(赫兹)采样精度(位数)/8声道数X时间(秒)=字节数,1.用44.10kHz的采样频率,每个采样点用16位的精度存储,则录制1分钟的立体声(双声道)节目,其WAV格式文件所需要的存储量:44

9、10016(bit)/82(声道)*60=10584000B=10 MB 2.用8kHz的采样频率,8位存储,则录制1分钟的单声道的WAV格式文件所需要的存储量:80008(bit)/81(声道)*60=48000B=468.75 KB,返回音频,24,多媒体计算机中的声音文件一般分为3类:Wave格式文件 MIDI格式文件 MPEG格式文件,数字音频的文件格式,25,Wave文件计算机通过声卡对自然界里的真实声音进行采样编码,形成Wave格式的声音文件,它记录的就是数字化的声波,所以也叫波形文件。常见格式WAV、VOC等。只要计算机中安装了声卡,就可以利用声卡录音。计算机不仅能通过麦克风录音

10、,还能把计算机里播放的CD、MIDI音乐和VCD影碟的配音录制下来。,Wave(.wav)格式文件,Wave文件的大小由采样频率、采样位数和声道数决定,26,MIDI文件乐器数字接口(musical instrument digital interface,MIDI)是在音乐合成器、乐器和计算机之间交换音乐信息的一种标准协议。MIDI文件是一种能够发出音乐指令的数字代码。与Wave文件不同,它记录的不是各种乐器的声音,而是MIDI合成器发音的音调、音量、音长等信息。,MIDI(.mid)格式文件,由于MIDI文件存储的是命令,而不是声音波形,所以生成的文件较小,只是同样长度的Wave音乐的几百

11、分之一。,27,MPEG(.mp1/.mp2/.mp3)格式文件,采用MPEG音频压缩标准压缩的文件。分为三层:MPEG-1 Audio Player 1/2/3,分别对应mp1、mp2、mp3这三种音频文件。上述Wave格式和MIDI格式均可压缩成MPEG格式。,28,Wave格式文件是通过外部音响设备输入到计算机的数字化声音;MIDI格式文件是完全通过计算机合成产生的;MPEG格式文件是采用MPEG音频标准进行压缩的文件。,小结,返回本节目录,返回音频,29,图形和图像的概念 图像的数字化 图形图像文件的存储格式 图像的分辨率,图形和图像,返回本节目录,30,在计算机中,图形和图像是一对既

12、有联系又有区别的概念。图形(Graphic):利用绘图软件绘制的由直线、圆、任意曲线等图元组成的画面,以矢量图形式保存。(Word中的绘图)图像(Image):由扫描仪、数字照相机、摄像机等输入设备捕捉的真实场景,以位图形式保存。,图形和图像的概念,31,矢量图中存储的是一组描述各个图元的大小、位置、形状、颜色、维数等属性的指令集合,如line(x1,x2,y1,y2,color),通过相应的绘图软件读取这些指令,将其转换为输出设备上显示的图形。由于在图形文件中只记录生成图的算法和图上的特征点,所以数据量较小,矢量图最大的优点是在打印输出和放大时不失真。,矢量图(Vector Based Im

13、age),32,位图文件中存储的是构成图像的每个像素点的亮度和颜色,位图文件的大小与分辨率和色彩的颜色种类有关,放大和缩小要失真,占用的空间比矢量图大。格式有:BMP、GIF、JPEG、TIFF、PCX等。,位图(Bit Mapped Image),矢量图,位图,33,矢量图的平滑边缘,位图的马赛克现象,34,当图片很复杂时,计算机需要花费很长时间执行绘图指令,特别对于复杂的彩色照片,就很难用数学表达式来描述,这时往往采用位图。绘制和显示矢量图的软件通常称为绘图程序(draw programs),绘制和显示位图的软件通常称为画图程序(paint programs)。,绘图程序和画图程序,返回图

14、形与图像,35,现实中的图像是一种模拟信号。图像的数字化指将一幅真实的图像转换为计算机能够接受的数字形式,需要经过对图像的采样、量化和编码等过程。,采样,量化,编码,图像的数字化过程,图像的数字化(1),36,图像采样就是将连续的图像转换为离散点的过程,实质是用若干个像素(Pixel)来描述这幅图像,其结果就是通常说的分辨率,点数越多,分辨率越高,图像越清晰,存储量也越大。,图像的数字化(2),采样,37,采样图像:以1616个像素点表示,图像的数字化(3),采样与编码,图像的编码,38,量化是在图像离散化以后,将表示图像色彩浓淡的连续变化值离散化为整数值的过程。图像的色彩值称为图像的颜色深度

15、,例如:黑白图 颜色深度为1位 灰度图 颜色深度为8位 RGB24位真彩色 颜色深度为24位,图像的数字化(4),量化,39,单色图和灰度图的比较,返回颜色深度,40,分辨率相同的情况下不同颜色深度的比较:,宽度:271高度:300颜色深度:1大小:9.9 KB,宽度:271高度:300颜色深度:2大小:19.8 KB,41,宽度:271高度:300颜色深度:8大小:79.4 KB,宽度:271高度:300颜色深度:24大小:238.2 KB,分辨率相同的情况下不同颜色深度的比较:,42,非压缩静态图像的存储容量计算公式,图像分辨率颜色深度(位数)/8=存储容量(字节数),单色640480的像

16、素点阵需要的存储空间:6404801/8=38 400字节=37.5KB 256色640480的像素点阵需要的存储空间:6404808/8=307 200字节=300KB 24位真彩色640480的像素点阵需要的存储空间:64048024/8=921 600字节=900KB(1MB),返回图形与图像,43,常见的图形图像文件,(1)BMP(.bmp)和DIB(.dib)格式文件 Windows环境中经常使用的一种位图格式。特点是包含的图像信息比较丰富,几乎不进行压缩。在单机上比较流行。(2)GIF(.gif)格式文件 最初的GIF只能存储单幅静止图像(GIF87a规范)GIF89a规范则可以存

17、储多幅静止图像,从而形成动画。在网络上非常流行。,44,图形图像文件,(3)JPEG(.jpg)格式文件 利用JPEG方法压缩的图像格式,压缩比高,但是压缩/解压缩算法复杂,存储量大,显示速度慢。同一图像的BMP格式的大小是JPEG格式的510倍,GIF格式虽小,但最多只能显示256色,JPEG适合处理256色以上的图像和大幅图像。,45,图形图像文件,(4)PNG(.png)格式文件 PNG是一种新兴的网络图像格式。它的主要特点是目前最不失真的格式。既能把图像文件压缩到极限,又能保留所有与图像品质有关的信息,显示速度快也是很重要的特点之一。,46,图形图像文件,(5)WMF(.wmf)格式文

18、件 矢量图形文件。Windows中许多剪贴画是以该格式存储的。广泛应用于桌面出版印刷领域。,返回图形与图像,47,分辨率和图象的像素有直接的关系,一张分辨率为640480像素的图片,它的分辨率就达到了307,200像素,也就是我们常说的30万像素.一张分辨率为16001200的图片,它的像素就是200万。分辨率的两个数字表示的是图片在长和宽上占的点数的单位。一张数码图片的长宽比通常是4:3。,48,像素数越小,图像的面积也越小,相应的其容量也越小。在实际应用中,大的像素可用于高质量的大幅面输出。在成像的两组数字中,前者为图片长度,后者为图片的宽度,两者相乘得出的是图片的像素,长宽比一般为4:3

19、。在大部分数码相机内,可以选择不同的分辨率拍摄图片。,49,以500万像素级的数码相机为例,其输出照片的最大分辨率为25601920,有效像素即为25601920=491.5万,约492万。如果用输出设备按300DPI(DPI点/英寸)的输出精度打印照片,那么就可以输出2560300=8.5英寸,即可以输出8英寸的照片;如果将数码照片进行数码冲印,那么按照数码冲印150DPI的最低冲印精度计算,那么就可以输出2560150=17英寸,即可以输出17英寸的照片。200万像素的数码相机一般可以达到16001300的照片分辨率,如果采用150DPI的最低冲印精度进行数码冲印,就可以得到10英寸的照片

20、这对一般的家用来说还是足够了。,数码照片的冲印尺寸与照片的分辨率的换算关系,数码照片长边像素数照片输出精度=输出照片的尺寸,50,数码照片的放大和缩小,一般在数码照片的分辨率范围内放大和缩小照片,不会影响照片观看质量如果在数码照片的分辨率范围外放大照片,会使照片看起来很模糊。这是因为超过分辨率后,会用插值的方法增大照片的分辨率,而所插的值是根据该像素周围其他像素的色彩值计算出来的,不是现场摄录时的真实记录,有出入,所以会使照片看起来模糊,不真实。因此我们要根据照片的用途,选择数码照相机的分辨率,一方面能使照片尽可能少的占用存储空间,又能满足放大的需求,51,数码相机,卡片相机是指小巧的外形、相

21、对较轻的机身以及超薄时尚的设计。它们功能并不强大,但是具备最基本的曝光补偿功能,区域或者点测光模式等,能满足普通用户的需要 单反就是指单镜头反光,即SLR(Single Lens Reflex),这是当今最流行的取景系统,大多数35mm照相机都采用这种取景器。在这种系统中,反光镜和棱镜的独到设计使得摄影者可以从取景器中直接观察到通过镜头的影像。因此,可以准确地看见胶片即将“看见”的相同影像。,52,数码相机,我国的数码相机是近几年前才悄然兴起的,但由于数码相机的发展飞快,目前市面上主流的数码相机像素数在500万-1000万之间。从经销商的品牌来看,主要是以名牌产品为主,其中最为主流的品牌有如富

22、士(FujiFilm)、佳能(Canon)、奥林巴斯(Olympus)、柯达(Kodak)、索尼(Sony)、卡西欧(Casio)、柯尼卡美能达(Konica-Minolta)、尼康(Nikon)、三星(Samsung)、宾得等,而国内的数码相机有如联想(Lenovo)、方正(Founder)、中恒(DEC)、紫光(Thunis)等。,53,图片文件分为位图图像和矢量图形2大类:位图图像通过计算机输入设备采集生成位图文件;矢量图形由图的几何特征生成。位图和矢量图的比较:存储空间:矢量图比位图小 效果:矢量图在屏幕上不如位图逼真 处理速度:矢量图比位图慢一些但是矢量图无论放大、缩小或变形都不会影

23、响图形质量,小结,54,小结,图像的数字化包含三方面工作:采样图像离散点 分辨率量化颜色离散点 颜色深度编码解决信息的压缩表示颜色深度的位数决定了图像的层次和色彩的丰富程度。分辨率决定了图像的细致程度。,返回图形与图像,图像分辨率颜色深度(位数)/8=字节数,55,4.视频,视频是将一幅幅独立图像组成的序列按照一定的速率连续播放,利用视觉暂留现象在人的眼前呈现出连续运动的画面。模拟视频常用两种标准:NTSC制式(30帧/秒,525行/帧)PAL制式(25帧/秒,625行/帧),我国采用PAL制式。,模拟视频和数字视频容量计算(未压缩的)640480 3 30 60=1 658 880 000字

24、节,分辨率,帧/秒,采样深度,时间,56,常用视频文件格式,AVI(Audio-Video Interleaved)文件将视频与音频信息交错地保存在一个文件中,较好地解决了音频与视频的同步问题,已成为Windows视频标准格式文件MOV文件利用它可以合成视频、音频、动画、静止图像等多种素材。MPG(.mpg)文件是按照MPEG标准压缩的全屏视频的标准文件。DAT文件是VCD专用的格式文件,文件结构与MPG文件格式基本相同,57,流媒体概述,流媒体一种可以使音频、视频等多媒体文件能在Internet上以实时的、无需下载等待的流式传输方式进行播放的技术,应用互联网直播 视频点播 远程教育 视频会议

25、系统,58,常用流媒体文件,RealMediaRA(RealAudio)用来传输接近CD音质的音频数据RM(RealVideo)在低速率的网络上实时传输活动视频影像RF(RealFlash)一种高压缩比的动画格式QuickTime是数字媒体领域事实上的工业标准,是创建3D动画、实时效果、虚拟现实、A/V和其他数字流媒体的重要基础。ASF与WMAASF是一种数据格式,音频、视频、图像以及控制命令脚本等多媒体信息通过这种格式,以网络数据包的形式传输,实现流式多媒体内容发布。WMV是微软公司推出的与MP3格式齐名的一种音频格式,是用于高清晰度映像的编解码器。,59,数据压缩技术,无损压缩无损压缩方法原理是统计被压缩数据中重复数据的出现次数来进行编码,能确保解压后的数据不失真。有损压缩有损压缩方法是以牺牲某些信息(这部分信息基本不影响对原始数据的理解)为代价,换取了较高的压缩比。,数据压缩的国际标准 JPEG标准 适用于连续色调和多级灰度的静态图像 MPEG标准 适用于运动图像、音频信息。包括MPEG视频、MPEG音频、MPEG系统(视频和音频的同步)。MPEG已制定了MPEG-1、MPEG-2、MPEG-4和MPEG-7四种。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号