计算机专转本辅导第5章数字与媒体.ppt

上传人:小飞机 文档编号:6059298 上传时间:2023-09-19 格式:PPT 页数:135 大小:5.15MB
返回 下载 相关 举报
计算机专转本辅导第5章数字与媒体.ppt_第1页
第1页 / 共135页
计算机专转本辅导第5章数字与媒体.ppt_第2页
第2页 / 共135页
计算机专转本辅导第5章数字与媒体.ppt_第3页
第3页 / 共135页
计算机专转本辅导第5章数字与媒体.ppt_第4页
第4页 / 共135页
计算机专转本辅导第5章数字与媒体.ppt_第5页
第5页 / 共135页
点击查看更多>>
资源描述

《计算机专转本辅导第5章数字与媒体.ppt》由会员分享,可在线阅读,更多相关《计算机专转本辅导第5章数字与媒体.ppt(135页珍藏版)》请在三一办公上搜索。

1、第5章 数字媒体及应用,5.1 文本与文本处理 5.2 图像与图形 5.3 数字声音及应用5.4 数字视频及应用,本章考题题型分布,5.1 文本与文本处理,5.1.1 字符的编码5.1.2 文本准备5.1.3 文本的分类5.1.4 文本编辑、排版与处理5.1.5 文本的展现,文字处理是计算机应用的基础,计算机应用使用计算机进行信息处理,其中,文字信息处理是涉及面最广的一种计算机应用,几乎与任何领域任何人都有关。,传统的文字处理过程,计算机文字处理过程,文字信息在计算机中称为“文本”(text),文本是计算机中最常用的一种数字媒体文本由一系列“字符”(character)组成,每个字符均使用二进

2、制编码表示文本在计算机中的处理过程是:,5.1.1.字符在计算机中的表示,字符、字符集及其编码表,文字的基本元素是字母和符号,统称为“字符”(character),它包括:字母、数字、标点、符号等字符集:一组特定字符的集合不同的字符集包含的字符数目与内容不同,如:中文字符集、西文字符集、日文字符集等字符的编码:字符集中每个字符的二进位表示,称为该字符的编码或代码(code)不同的字符其编码各不相同字符集中所有字符的编码的一览表,称为该字符集的码表,一、西文字符的编码ASCII码,西文是表音文字(拼音文字),它由拉丁字母、数字、标点符号以及一些特殊符号所组成美国标准信息交换码(ASCII码):A

3、SCII字符集包含96个可打印字符和32个控制字符采用7个二进位进行编码计算机中使用1个字节存储1个ASCII 字符存在问题:字符集太小(只有128个字符)不同国家和地区使用不同的字符集及其编码,互不兼容东亚地区使用的大字符集无法编码,GB2312汉字编码字符集,1980年颁布信息交换用汉字编码字符集基本集(我国第一个国家标准)GB2312-1980GB2312字符集由三个部分构成:,拉丁字母、俄文、日文平假名与片假名、希腊字母、汉语拼音等共682个,共6763个汉字和682个符号,每个汉字和符号都有一个确定位置,区位码:GB2312国标字符集构成一个二维平面,它分成94行、94列,行号称为区

4、号,列号称为位号。问题:文本中的汉字与西文字符易与单字节的标准ASCII码混淆不清。例如:“大”字的区号20,位号83,区位码是20 83,用2个字节表示为:00010100 01010011(1453H)。解决方法:把一个汉字看作两个扩展ASCII码,即每个汉字的区号和位号必须分别加上32(即 0010 0000),且使表示GB2312汉字的两个字节的最高位(b7)都等于“1”。,这种高位为 l 的双字节(16位)汉字编码就称为GB2312汉字的“机内码”,又称内码。例如:“大”字的内码是:10110100 11110011(B4F3)。,汉字的区位码、国标码、机内码的关系:国标码=区位码+

5、2020H 机内码=国标码+8080H 机内码=区位码+A0A0H汉字机内码双字节,最高位是1;西文字符机内码单字节,最高位是0。,GBK汉字内码扩充规范,GB2312的不足:汉字字数太少,缺少繁体字,无法满足人名、地名、古籍整理、古典文献研究等应用的需要;与ASCII码不兼容GBK汉字内码扩充规范(1995):在GB2312基础上,增加了1万多汉字(包括繁体字)和符号共有21003个汉字和883个图形符号,如“計算機”、冃、冄、円、冇等繁体字和生僻字 与GB8312保持向下兼容,也使用双字节表示,第1字节最高位必须为“1”:,UCS/Unicode多文种大字符集,背景:为了实现全球数以千计的

6、不同语言文字的统一编码方案:ISO将全球所有文字字母和符号集中在一个字符集中进行统一编码(目前共收集了17x2161,114,112 个),称为UCS/UnicodeUCS/Unicode的编码方案:先实现部分字符的编码(共107,361个字符)尽量与已有编码标准兼容其中包含有中、日、韩统一整理出来的近3万汉字(CJK汉字)允许有若干不同的编码方案,例如:,GB18030汉字编码标准,背景:无论是Unicode的UTF-8还是UTF-16,其CJK汉字字符集虽然覆盖了我国已使用多年的GB2312和GBK标准中的汉字,但它们的编码并不相同为了既能与UCS/Unicode编码标准接轨,又能保护我国

7、已有的大量汉字信息资源,我国在2000年和2005年两次发布GB18030汉字编码国家标准。GB18030实质上是UCS/Unicode字符集的另一种编码方案:单字节编码(128个)表示ASCII字符双字节编码(23940个)表示汉字,与GBK(以及GB2312)保持向下兼容,GBK不再使用四字节编码(约158万个)用于表示 UCS/Unicode中的其他字符GB18030目前已在我国信息处理产品中强制贯彻执行。,小结:几种汉字编码的对比,例:IE浏览网页时文字编码的选择,5.1.2.文本准备 文稿如何输入计算机,文字符号输入计算机的方法,键盘输入,(1)数字编码,如电报码、区位码等,(2)字

8、音编码,如智能ABC等(3)字形编码,如五笔字形和表形码等,(4)形音编码发展趋势:基于统计和学习功能的以词语(短语)或句子作为输入单位的输入方法,文字符号输入计算机的方法,优点:自然,流畅小型化,适合移动计算不足:识别速度和正确性还需提高书写要求还要降低,文字符号输入计算机的方法,优点:自然,方便,适合移动计算不足:对说话人、说话方式、说话内容的适应能力要大大增强识别速度和正确性还需大大提高,文字符号输入计算机的方法,识别率已达到98%功能:简、繁体字混合识别中文、西文混合识别文字、表格混合识别智能校对功能,文字符号输入计算机的方法,技术上非常困难,还无法实用目前准备先突破工整的楷书手写体的

9、识别!,汉字的键盘输入,汉字与键盘上的键无法一一对应,因此必须使用几个键来表示一个汉字,这就称为汉字的“键盘输入编码”优秀的汉字键盘输入编码应具有的特点:易学习、易记忆效率高(平均击键次数较少)重码少容量大(可输入的汉字字数多),汉字键盘输入方法的比较,5.1.3 文本的分类,简单文本(纯文本),没有字体、字号的变化,不能插入图片、表格,也不能建立超链接,其文件后缀名是.txt 由一串用于表达正文内容的字符编码所组成,几乎不包含任何其他的格式信息和结构信息 举例:,丰富格式文本,本书由南京大学出版社(Publishing House of Nanjing University)出版,有字体字号

10、等属性变化、设置了段落和页面排版格式的文本称为“丰富格式文本”丰富格式文本中,除了正文内容之外,还使用了许多“标记”来描述字符的属性和格式的设置。举例:下面标题的格式为:中文用黑体,西文用Arial Black体,居中,使用HTML语言描述为:,本书由南京大学出版社(Publishing House of Nanjing University)出版,用一对指出的是标记,如 和 等,用于说明排版的格式和文字属性,它们不属于正文内容,正文内容,超文本,若干文本或文本中的各个部分可按照其内容的关系互相链接起来,从而形成“超文本”,“超链”实际上就是一个指针,用于指向其他文本块,也可以指向同一文本块中

11、的其他部分,超链是有向的,起点位置称为链源,它可以是文本块中的一个标题、一句句子、一个关键词、一幅画、一个图标等,文本块可以是一个网页,一个文档,一段文字,也可以是一张图片,甚至一段声音或视频,小结:文本的分类,5.1.4 文本的编辑与排版,复习:使用Word的操作流程,创建新文档或打开老文档,文稿输入,编辑,排版,文档存盘、打印或发送,输入中西文字、符号和图表,进行增、删、改操作,保证文本的正确性,满足清晰、美观、便于使用等要求,目的:确保文本内容正确无误操作:对字、词、句和段落进行添加、删除、修改等操作MS Word的功能:在文本的任何位置都可以插入新的文字从文本的任何位置都可以删除不需要

12、的文字将一段文字从一处移动到另一处将一段文字从一处复制到另一处在文本中自动查找指定的词语用一个词语自动替换文本中指定的词语,文本编辑(text editing),目的:使文本清晰、美观、便于阅读操作内容:对文本中的字符、段落乃至整篇文章的格式进行设计和调整,分成3个层次:对字符格式进行设置对段落格式进行设置对文档页面进行格式设置,文本排版(格式化),设置字符的格式,字号(八号 初号,5磅72磅以上)1磅相当于1/72英寸 字体(宋体、楷体、黑体、仿宋、隶书)字符的修饰字符的形状(字形):正常、加粗、倾斜、加粗倾斜字形的修饰:下划线、着重号、上下标、删除线字符的颜色字符的宽度字符的间距字符的效果

13、字符的排列方向,Demo1,什么是段落?用“回车”相互隔开的一组文字段落格式的设置:段落的对齐方式(两端对齐、分散对齐、居中对齐、左对齐、右对齐)段落的缩进方式(首行缩进、悬挂缩进、左缩进、右缩进)段间距和段内行距使用编号和项目符号段落添加边框和底纹首字下沉或悬挂段落与分页的关系,设置段落的格式,Demo2,控制段落的缩进,段落缩进是指段落中的文本到正文区左、右边界的距离,包括段落左缩进、右缩进和首行缩进。其缩进的距离可由水平标尺上对应的三个缩进标记来指示,页面格式的设置:设置纸张大小和页边距设置每页的行、列数目设置分栏数目与格式设置页码设置页眉和页脚,设置页面的格式,设置页面的分栏,“所见即

14、所得”(操作效果屏幕立即可见,打印结果与屏幕所见完全相同)撤销(undo)和恢复(redo)操作格式刷多种视图(大纲视图与大纲编辑)自动更正、自动套用格式、自动编号、自动图文集 自动保存功能和自动备份功能样式、模板和向导(wizard)功能宏操作(Macro),提高Word操作效率的若干措施,文本处理初步,使用计算机对文本中的字、词、短语、句子、篇章进行识别、转换、分析、理解、压缩、加密和检索等有关的处理文本处理内容:字数统计,词频统计,简/繁体相互转换,汉字/拼音相互转换词语排序,词语错误检测,文句语法检查自动分词,词性标注,词义辨识,大陆/台湾术语转换关键词提取,文摘自动生成,文本分类文本

15、检索(关键词检索、全文检索),文本过滤文语转换(语音合成),文种转换(机器翻译)篇章理解,自动问答,自动写作等文本压缩,文本加密,文本著作权保护,什么是文本处理?,例:Word 2003的文本处理功能,英文拼写检查和英语同义词检查字数统计自动编写摘要中文简繁体转换和术语转换中英词语翻译语法和格式检查语音识别(口授命令和听写)文档保护(防止打开或修改文档),5.1.5 文本的展现(输出),文本的展现(输出),目的:阅读、浏览或打印文本使用的软件:文本阅读器/文本浏览器嵌入在文本编辑(处理)软件中,如微软的Word,独立的软件:如Adobe公司的Acrobat Reader,微软公司的IE等 文本

16、展现的过程:对文本的格式描述进行解释生成文字和图表的映像(bitmap)传送到显示器或打印机输出,附:输出过程中字形的生成,过程:先根据字符的字体确定相应的字库(font),再按照该字符的代码从字库中取出该字符的形状描述信息然后按形状描述信息生成字形,并按照字号大小及有关属性(粗体、斜体、下横线)将字形作必要的变换最后将变换得到的字形放置在页面的指定位置处2种不同的字库:,点阵描述,轮廓描述,5.2 图像与图形,5.2.1 数字图像的获取5.2.2 图像的表示与压缩编码5.2.3 数字图像处理与应用5.2.4 计算机图形,5.2.1 数字图像的获取,图像的获取过程,从现实世界中获得数字图像的过

17、程称为图像的“获取”常用的图像获取设备:扫描仪、数码相机、摄像头、摄像机等图像获取过程:,将画面划分为 M N个网格,每个网格称为 一个取样点,将彩色图像取样点的颜色分解成R,G,B三个基色,测量每个取样点的每个分量(基色)的亮度值,对取样点每个分量的亮度值进行A/D转换,使用数字整型量表示,5.2.2 图像的表示与压缩编码,数字(取样)图像的组成,数字取样图像由M(列)N(行)个取样点组成取样点是组成数字取样图像的基本单位,称为“像素”彩色图像的像素通常由3个彩色分量组成灰度图像和黑白图像的像素只包含1个亮度分量,黑白图象的表示,黑白图像,黑白图像的每个像素只有一个分量,且只用1个二进位表示

18、,其取值仅“0”(黑)和“1”(白)两种,例1:灰度图象的表示,灰度图像,灰度图像的每个像素也只有一个分量,一般用812个二进位表示,其取值范围是:02n-1,可表示2n个不同的亮度,例2:彩色图象的表示,彩色图像的每个像素有三个分量,分别表示三个基色的亮度,假设3个分量分别用n,m,k个二进位表示,则可表示2n+m+k种不同的颜色,数字(取样)图像的主要参数,图像大小(图像分辨率):用来表示组成该图像的行列数目,亦即图像所包含的像素数目使用 水平分辨率x垂直分辨率 表示对图像清晰度和在屏幕上显示出来的大小有影响颜色空间的类型,指彩色图像所使用的颜色描述方法,如:RGB(红、绿、蓝)模型,显示

19、器使用CMYK(青、品红、黄、黑)模型,彩色打印机使用HSB(色彩、饱和度、亮度)模型,用户界面中使用YUV(亮度、色度)模型,彩色电视信号传输时使用像素深度,即像素的所有颜色分量的二进位数目之和,举例:分辨率与图像尺寸的关系,520 x376,260 x188,130 x94,在显示比例相同时,显示在屏幕上的图像尺寸与图像分辨率成正比,数字图像的数据量,数字图像数据量的计算公式(以字节为单位):数据量=水平分辨率垂直分辨率像素深度8 几种常用格式的图像的数据量:,例:数字图像传输时间的计算假设数据传输速率为56 kb/s(电话上网),则传输一幅分辨率为640480的6.5万种颜色的未压缩图像

20、的最小时间为:(640 x480 x16)/56000=87.8秒,数字图像的数据压缩,图像数据压缩的必要性:节省存储数字图像所需要的存储器容量提高图像的传输速度,减少通信费用 图像数据压缩的可能性:数字图像中有大量的数据冗余人眼视觉有局限性,允许图像有一些失真,数字图像的数据压缩,图像数据压缩的两种类型:无损压缩:用压缩后的数据还原出来的图像没有任何误差有损压缩:用压缩后的数据还原出来的图像有一定的误差压缩编码方法的评价,数字图像的常用文件格式,不同的图象文件格式采用了不同的数据压缩技术和数据组织方法,有不同的应用常用的图像文件格式有:,图像文件格式例1:BMP格式,BMP图像格式是Wind

21、ows操作系统下使用的一种标准图像格式支持单色、16色、256色、真彩色图像一个文件一幅图像,可以进行无损压缩,也可不压缩非压缩的BMP文件是一种通用的图像文件格式,几乎所有Windows 应用软件都能支持,图像文件格式例2:GIF 图像,颜色数目不超过256色,适合用作插图、剪贴画等色彩数要求不高的场合,文件特别小,适合网络传输GIF图像格式具有累进显示功能,适合网络浏览器观看 GIF图像格式能支持透明背景(JPEG不支持)GIF图像格式能支持动画,透明背景,图像文件格式例3:JPEG图像,JPEG是静止图像数据压缩编码的国际标准,采用JPEG标准的图像文件扩展名是.jpgJPEG特别适合各

22、种连续色调的彩色或灰度图像,在计算机和数码相机中已得到广泛应用 JPEG的最新标准是JPEG2000(图像文件扩展名是.jp2),它采用更先进的技术,可取得更好的效果,目前在医学图像处理中使用,5.2.3 数字图像处理与应用,数字图象处理:目的与内容,目的:(1)提高图像的视觉质量(2)恢复与重建有失真和畸变的图像(3)图像分析,包括:图像的分类、识别和理解等(4)图像数据的变换、编码和数据压缩(5)图像的存储、管理与检索(6)图像内容与知识产权的保护 内容:去噪、增强、复原、分割、提取特征、压缩、存储、检索等,数字图像处理的应用,(1)图像通信,包括图像传输、电视电话、电视会议等。(2)遥感

23、(3)医疗诊断(4)工业生产中的应用,如产品质量检测,生产过程自动控制等(5)机器人视觉(6)军事、公安、档案管理等其他方面的应用,X光图像,CT图像,核磁共振图像,指纹图像,常用的图像编辑软件,Word和PowerPoint具基本的图像编辑功能Windows附件中的“画图”软件微软Office工具中的Picture ManagerACD System公司的ACDSee32Adobe PhotoShop,5.2.4 计算机图形,什么是计算机图形(graphics),通过计算机和软件对景物的结构、形状与外貌进行描述(称为“建模”),然后根据该描述和选定的观察位置及光线状况,生成该景物的图形(称为

24、“绘制”或“图像合成”)计算机图形也称为计算机合成图像计算机制作图形的步骤如下:,景物的2种描述(建模)方法,计算机图形的绘制过程,从景物模型绘制出图形的过程,实际上也是把景物的描述(模型)转换成为点阵(像素阵列)的过程,它包括下列步骤:,将各个物体的所有表面用小的多边形(三角形或四边形)进行近似表示,用户选择一个观测位置,并设定一个取景范围,将景物向成像平面作透视投影;然后将景物中不在取景范围内的部分裁剪掉,同时还把景物中所有被遮挡而看不见的部分隐去,根据景物表面材料的性质和环境光源的设定,计算出物体可见面上每一点(像素)的颜色及其亮度,计算出物体所产生的本影和半影;根据景物表面和背景使用的

25、材料,选择合适的纹理映射到物体的表面,美国康乃尔大学Suzanne Smits 和Priamos Georgiades建模并绘制的俄罗斯茶壶,例1:俄罗斯茶壶,例2:计算机绘制的钢笔画和铅笔画,木 桶,玻璃瓶,引用自:Georges Winkenbach,D.Salesin(Univ.of Washington)pp.469-476,SIGGRAPH96,显卡在绘制过程中起重要作用!,图形绘制过程中,每个像素的颜色及其亮度都要经过大量计算才能得到,因此绘制过程的计算量很大,特别是三维图形和动画目前PC机所配置的显卡(图形卡)上安装了功能很强的专用绘图处理器(GPU),它承担了绘制过程中的大部分

26、计算任务,计算机图形的应用,(1)计算机辅助设计和辅助制造(CADCAM)。(2)利用计算机生成各种地形图、交通图、天气图、海洋图、石油开采图等。(3)作战指挥和军事训练。(4)计算机动画和计算机艺术。(5)其它:电子出版、数据处理、工业监控、辅助教学、软件工程等。,矢量绘图软件,专业绘图软件:AutoCAD、PROTEL和CAXA电子图板(机械、建筑等)MAPInfo、ARCInfo、SuperMap GIS(地图、地理信息系统)办公与事务处理、平面设计、电子出版等使用的绘图软件:Corel公司的CorelDraw,Adobe 公司的Illustrator,Macromedia公司的Free

27、Hand,微软公司的Microsoft Visio等MS Office中内嵌的绘图软件:Word 和 PowerPoint中的绘图功能(简单的二维图形),小结:图像与图形的比较,计算机中的“图”按其生成方法可以分为两大类:通过数字化设备获取的“图”,它们称为取样图像、点阵图像,或位图图像等,通常简称图像(image)通过计算机建模并绘制而成的“图”,称为矢量图形,通常简称图形(graphics);两者在外观上很难区分,但它们有许多不同的属性,一般需要使用不同的软件进行处理,图 形,5.3 数字声音及应用,5.3.1 波形声音的获取与播放5.3.2 波形声音的表示与应用5.3.3 波形声音的编辑

28、5.3.4 计算机合成声音,5.3.1 波形声音的获取与播放,声音的特性和类型,声音由振动产生,通过空气传播声音是一种波,它由许多不同频率的谐波组成谐波的频率范围称为声音的“带宽”,计算机处理的声音类型:话音或语音(speech),专指人的说话声音,带宽仅为3003400Hz全频带声音(如音乐声、风雨声、汽车声等),其带宽可达到20Hz20kHz 人耳可听到的声音统称“可听声”,20Hz20kHz,数字波形声音的获取,步骤:,2.量化(quantization,模数转换),3.编码(encoding),1.取样(sampling),数字波形声音的获取设备,声音的联机获取设备(声卡),声波转换为

29、电信号,声音的脱机获取设备:数码录音笔,取样、量化和编码,声音的重建与播放,计算机输出声音分为两步:1 声音的重建:把声音从数字形式转换成模拟信号形式,由声卡完成,2 声音播放:将模拟声音信号经处理和放大后送到音箱(扬声器)关于音箱:普通音箱接收的是重建的模拟声音信号数字音箱直接接收数字声音信号,失真更小,声卡的功能与逻辑组成,波形声音的获取与编码波形声音的重建与播放MIDI消息的输入MIDI音乐的合成,选讲:声卡的物理实现,声卡主要由2块芯片组成:主处理芯片:包括数字信号处理器、MIDI控制、I/O控制等 CODEC芯片:负责多声道取样、A/D与D/A转换、混音处理等,当前PC机的声卡大多已

30、不再做成独立的插卡形式,而是与主板集成在一起,称为集成声卡,5.3.2 波形声音的表示与应用,数字波形声音的表示及其参数,数字波形声音是使用二进位表示的一种串行比特流,其数据按时间顺序进行组织,文件扩展名为“.wav”数字波形声音的主要参数有:取样频率:语音的取样频率低,一般为8k 16k Hz全频带声音(如音乐)取样频率高,一般为44.1k 48k Hz量化位数:通常为8位、12位或16位声道数目:单声道为1,双声道为2码率(比特率),每秒钟的数据量,数字波形声音码率的计算,未压缩时数字波形声音的码率计算公式 码率=取样频率 量化位数 声道数 例:,压缩编码之后数字波形声音的码率为:压缩后的

31、码率=未压缩时的码率/压缩倍数 例:上面CD唱片的立体声音乐压缩为MP3后,若压缩倍数是12倍,则该MP3音乐的码率是:118 kb/s左右,数字波形声音的数据压缩,数据压缩的必要性:为了降低存储成本和提高在网络上的传输效率数据压缩的可能性:声音中包含有大量冗余信息;人耳灵敏度有限,允许有一定失真而不易察觉数字波形声音压缩编码的方法:全频带声音:国际标准MPEG;工业标准Dolby AC-3 数字语音:固定电话使用ADPCM编码 手机使用高效率的混合编码技术,所谓“MP3音乐”,它是一种采用MPEG-1层3编码的高质量数字声音,压缩比大约1012倍,使一张普通CD光盘上可以存储大约100首MP

32、3歌曲,可连续播放10小时。,MP3播放器的结构与原理,嵌入式处理器用于运行控制程序,控制各个部件协调工作:它接收控制按键的操作命令,从闪烁存储器读取MP3音乐数据送到DSP去解码;显示播放器的工作状态;负责与主机连接并交换数据等等,数字信号处理器DSP完成MP3数据流的解码操作,并输出波形格式的数字音频信号,经数模转换和功率放大之后,用户即可听到声音,存放MP3音乐数据,容量越大,可存放的歌曲数目就越多,固定存放MP3播放器的控制程序,显示MP3播放器的工作状态和歌曲的歌词,波形声音的文件类型及其应用,什么是流媒体?,在因特网上收听(看)音(视)频节目的2种方式:下载存储方式:先下载存储在计

33、算机中,下载完毕后再播放(缺点:需要等待很长时间,并需要较大的存储容量)流式传输方式:边下载、边播放(优点:只需要下载一部分数据之后,就可以开始一边播放一边下载,等待时间短、存储需求小)流媒体就是一种允许在网络上让用户一边下载一边收看(听)音视频媒体的媒体分发(delivery)技术目前流行的主要有3个公司的流媒体技术:Real Networks公司的 Real Media(RealAudio和RealVideo)微软公司的 Windows Media Services(WMA、WMV和ASF)苹果公司的 Quick Time,5.3.3 波形声音的编辑,波形声音编辑软件的功能,主要功能:1

34、编辑声音:如声音剪辑、复制、调节音量2 声音的效果处理:如混响、回声、淡入、淡出等3 录音4 声音的格式转换5 播放声音,声音编辑软件的典型用户界面,5.3.4 计算机合成声音,什么是计算机合成声音?,计算机合成声音就是计算机模仿人说话或演奏音乐计算机合成声音有两类:计算机合成话音(语音):计算机模仿人把一段文字朗读出来,即把文字转换为说话声音(简称为 TTS)应用:有声查询、文稿校对、语言学习、语音秘书、自动报警、残疾人服务等计算机合成音乐:计算机模拟各种乐器发声并按照乐谱演奏音乐应用:计算机作曲、配器等,例:计算机合成的语音,Hello,everybody(1)你好,我是贝尔实验室的中文语

35、音合成系统(BellTTS1)南京大学计算机系2002年招收了202名本科生,22名博士生,130多名硕士生。(中科大讯飞公司)(Bell)安徽中科大讯飞信息科技有限公司是专门从事中文语音及语言技术软件(讯飞)我们都是同行,我们一路同行,去参加人参培植研讨会(讯飞)(Bell),计算机合成音乐(MIDI),计算机合成音乐需要三个要素:乐器、乐谱和“演奏员”,声卡上的音乐合成器能像电子琴一样模仿几十种不同的乐器发出声音,它按照MIDI消息合成出不同音色和音调的音符,通过扬声器播放出音乐来,乐谱在计算机中使用一种叫做MIDI的音乐描述语言来表示。使用MIDI描述的音乐称为MIDI音乐。一首乐曲对应

36、一个MIDI文件,其文件扩展名为.MID或.MIDI,媒体播放器软件相当于“演奏员”。播放MIDI音乐时,它先从磁盘上读入.MID文件,解释其内容,然后以MIDI消息的形式向声卡上的音乐合成器发出各种指令,选讲:音乐合成器,PC机声卡一般都带有MIDI音源(音乐合成器)MIDI音源有两种:调频合成器(一种受控的电子振荡器)。音色单调,效果较差,已很少使用波表合成器。音色丰富,效果很好,可扩展,现广泛使用 波表合成器的原理预先将真实乐器演奏的各个音符的波形数字化,把它们组织成一个个波表文件存放在存储器中播放时合成器软件根据乐器类型和音符参数等将相应的波形数据修饰成所要求的音强和时长,然后合成、加

37、工后播放,例:计算机合成的MIDI音乐,例1 音乐之声(6KB)例2 军港之夜(7KB)MIDI的优点:数据量极小(比CD立体声少3个数量级,比MP3少3个数量级)易于制作和编辑修改可以与波形声音同时播放MIDI的不足:只能合成音乐,不能合成歌曲和语言音质与硬件设备相关,小结:计算机中的数字声音,数字声音的特点:是一种连续媒体,传输与播放有实时性要求数据量大,对存储和传输的要求比较高,必须进行压缩 数字声音的类型:取样(波形)声音数字语音:应用于电话、手机、多媒体配音等全频带声音:CD和DVD音乐,数字电视伴音等计算机合成声音合成语音合成音乐(MIDI),5.4 数字视频及应用,5.4.1 数

38、字视频基础5.4.2 数字视频的压缩编码5.4.3 数字视频的编辑5.4.4 合成视频计算机动画5.4.5 数字视频的应用,5.4.1 数字视频基础,彩色电视信号的发送与接收,彩色电视信号的发送与接收:,PAL制彩色电视信号的颜色不使用RGB表示,而是使用亮度信号Y和两个色度信号U、V来表示,为进行远距离传输必须进行调制,将Y、U、V信号转换成为R、G、B 信号,然后再进行显示,使用Y、U,V彩色空间的原因:与黑白电视保持兼容利用人的视觉特性来节省电视信号的带宽和发射功率,数字视频信号的获取,视频信号的数字化过程:与图像、声音的数字化过程相仿,但更复杂一些,数字视频的获取设备:视频采集卡(简称

39、视频卡)数字摄像头,通过光学镜头和CCD或CMOS采集动态图像,转换成数字信号并输入PC机 脱机获取设备:数码摄像机,视频捕获(采集)卡的功能,从多种视频源中选择一种作为视频输入;支持不同的电视制式;能同时处理图像信号的伴音;显示器上可监看输入的视频信号,位置及大小可调;能将计算机生成的图像/图形/文本与视频图像迭加处理;可随时冻结(定格)一幅画面,并按指定格式保存;可 实时压缩与存储视频及其伴音信息;可 实时解压缩并播放视频及其伴音信息,输出设备可选(VGA监视器、电视机、录相机等),视频卡、显卡与主机的关系,硬 盘,(主机),视频信号数字化并存入硬盘,在屏幕上监看视频信号,计算机图形文字输

40、出,在电脑上播放视频,在电视机上播放视频,数字摄像头,分辨率为352288 640480速度一般在30fps(每秒30帧)左右镜头的视角可达到45-60度 支持USB接口 或IEEE1394(火线)接口成像器件采用CMOS或CCD,数码摄像机,提供480线以上的分辨率,清晰度高自动对焦,自动曝光 使用MPEG-2进行压缩编码,然后记录在硬盘上具有录音功能数据量很大,采用USB接口或IEEE1394接口,5.4.2 数字视频的压缩编码,数字视频的压缩编码,视频数据压缩的必要性:数字视频的数据量大得惊人,1分钟的数字电视图像未压缩时其数据量可超过1GB,对存储、传输和处理都有很大的困难视频数据压缩

41、的可能性:视频信息的每个画面内部有很多信息冗余相邻画面的内容有高度的连贯性人眼的视觉灵敏度有限,允许画面有一定失真结论:数字视频的数据量可压缩几十倍甚至几百倍,数字视频的三类编码标准,ITU-T国际标准:H.261(Px64)标准、H.263标准等ISO/IEC 国际标准:MPEG-1标准,MPEG-2标准(等同于ITU-T H.262),用于低分辨率、低码率视频应用的MPEG-4 ASP,代表当前技术水准的MPEG-4 AVC视频编码标准(等同于ITU-T H.264),在HDTV、蓝光盘、XBOX、iPod、iPhone等众多领域得到推广应用。公司标准:Intel公司的IndeoVideo

42、,苹果公司在QuickTime中使用过的Cinepak,Real Network公司的RealVideo,微软公司的 WMV,Adobe公司Flash播放器中使用的VP6等,目前流行的数字视频编码标准,什么是MPEG-4 ASP和MPEG-4 AVC,MPEG-4是数字音视频压缩编码的国际标准MPEG-4分成23个部分,其中part 2和part 10是视频编码为了适应不同应用对视频图像大小和质量的不同要求,每种视频编码标准都分成若干level和profile:MPEG-4 Part 2 分成21个profile,ASP(Advanced Simple Profile)是其中之一,其技术特点是

43、:画面分辨率较低,最低码率仅64kb/s左右,但画面质量好,复杂度中等MPEG-4 Part 10又称为MPEG-4 AVC(Advanced Video Coding).它是目前技术最先进的视频编码案,分成7个profile,可用于HDTV,音像文件与播放器,播放器(Plaper)实际上就是一种解码器,但通常既可以解码多种类型的信息(音频、视频、图片、),还能解码多种不同类型的音像文件格式。PC上使用的是软件播放器,一台计算机可以安装多个不同的播放器:微软公司的“Microsoft Media Player”,苹果公司的QuickTime Player和iTunes,Real公司的RealP

44、layer(简称RealOne 播放器)“全能”播放器:Storm Player(暴风影音)、The KMPlayer、绚彩魅影、变色龙万能播放器(PPStream)、豪杰超级解霸,等等硬件播放器(便携式):MP3播放器:以播放MP3格式的音频信息为主,也能收听广播、观看文本和图片,功能更强一些的还能播放视频信息MP4播放器:以播放视频为主,国外叫做PVP(个人视频播放器)或PMP(便携式媒体播放器),LCD屏幕较大,价格较高,什么是MP4?,MP4播放器是一种能够播放视频的便携式设备,也叫做PVP(个人视频播放器)或PMP(便携式媒体播放器)功能:看录像(电影)播放音乐浏览文本和图片甚至还可

45、以上网技术特点:自带25英寸的LCD屏存储容量达几十GB,5.4.3 数字视频的编辑,例:简单的视频编辑软件 Windows Movie Maker,由微软公司开发,在Windows XP平台上运行功能:通过摄像机、数字摄像头或其他视频源将音频和视频捕获到计算机中打开已有的音频、视频或静止图片,对音频与视频内容进行编辑(包括添加片头、使用视频过渡或特技效果等)将制作的视频保存到硬盘中,或刻录在CD或DVD光盘上,供“媒体播放器”进行播放,5.4.4 合成视频计算机动画,什么是计算机动画?,计算机动画使用计算机生成一系列内容连续的画面供实时演播的一种技术,它是一种计算机合成的数字视频,而不是用摄

46、像机拍摄的“自然视频”上世纪九十年代开始,计算机动画技术应用于电影特技,如电影“侏罗纪公园”、玩具总动员、泰坦尼克等,取得轰动效应应用领域:影视和广告领域:电影特技、动画片、电视广告制作等教育和培训领域:辅助教学、驾驶员训练等科技领域:科学计算可视化,复杂系统的动态模拟军事领域:军事训练、作战模拟等游戏,计算机动画的制作过程,计算机动画制作包括:在计算机中建立景物的模型、描述它们的运动、生成一系列逼真的图像三维计算机动画制作过程分以下几个阶段:(1)描述景物的形状与结构(建模)(2)确定景物的颜色和材质(纹理)(3)设置灯光和确定虚拟摄像机的位置(4)描述场景中物体的运动和摄像机的移动(5)绘

47、制一系列的图像(6)输出动画结果,动画制作软件,著名的造型与动画制作的商品化软件:加拿大Alias公司的Power animator 法国TDI公司的Explore荷兰ElectroGIG公司的3DGO加拿大Vertigo公司的Vertigo美国Wavefront公司的Advanced Visualizer美国SGI公司Alias和Wavefront 公司的MAYA美国Autodesk公司Discreet公司的3ds max,Animator Studio,互联网动画:GIF和Flash,GIF动画(参见5.2节):Adobe(Macromedia)公司的Flash动画画面大小可任意调节,用户

48、可控制播放过程既可生成自动可执行文件(*.exe),还可生成用 Flash 播放器播放的文件(*.SWF);既可做成单独的动画,也可以嵌入网页文件采用流式传输方式,可以边下载边进行播放演示,5.4.5 数字视频的应用,VCD与DVD可视电话与视频会议数字电视点播电视,什么是VCD,什么是DVD?,VideoCD(简称VCD):按MPEG-1标准将60分钟的音频/视频节目记录在一张CD光盘上,图像质量为VHS(352240),即家用录放像机的水平,可播放立体声 DVD-Video(简称为DVD影碟):按MPEG-2标准将音频/视频节目记录在DVD光盘上,图像质量为广播级(720576),可播放5

49、.1声道的环绕立体声,单面单层DVD(容量为4.7GB)光盘可记录120分钟以上的影视节目,VCD与DVD的比较,可视电话和视频会议,可视电话:通话双方能互相看见的一种电话系统电话机具有摄像、显示、声音等功能,内置高质量CCD镜头及MODEM视频会议:多人同时参与的一种音/视频通信系统类似于可视电话,但多人参加通话,提供的功能也更加丰富两种实施方式:在电信局的数字通信网上进行在互联网上进行,例如使用下列即时通信软件:微软的MSN Messenger,腾迅的QQ,网易的POPO,新浪的UC等,什么是数字电视?,数字电视指的是:电视节目的制作(摄录、编辑)、处理、传输、接收播放全过程的数字化,特别

50、是将电视信号进行数字化之后以数字形式进行传输和接收;数字电视的范围:高端全高清晰度电视(HDTV),分辨率1920 x1024中端常规模拟电视的数字化(DTV),720 x480低端包括互联网上的IPTV等,数字电视的优点,(1)频道利用率高可传输的数字电视节目比传输模拟电视节目增加好几倍(2)抗干扰能力强同等传输条件下的抗干扰能力优于模拟电视(3)图像清晰度高用户接收到的图像质量能达到演播室水平(4)音响效果好具有CD级音质效果,可支持5.1环绕立体声家庭影院(5)可开展基于TV的交互式数据业务包括电视购物、电视银行、电视商务、电视游戏、点播电视等业务,数字电视的传播途径,什么是点播电视(V

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号