第5章数字媒体及应用.ppt

上传人:sccc 文档编号:5954021 上传时间:2023-09-08 格式:PPT 页数:135 大小:4.70MB
返回 下载 相关 举报
第5章数字媒体及应用.ppt_第1页
第1页 / 共135页
第5章数字媒体及应用.ppt_第2页
第2页 / 共135页
第5章数字媒体及应用.ppt_第3页
第3页 / 共135页
第5章数字媒体及应用.ppt_第4页
第4页 / 共135页
第5章数字媒体及应用.ppt_第5页
第5页 / 共135页
点击查看更多>>
资源描述

《第5章数字媒体及应用.ppt》由会员分享,可在线阅读,更多相关《第5章数字媒体及应用.ppt(135页珍藏版)》请在三一办公上搜索。

1、第5章 数字媒体及应用,5.1 文本及文本处理 5.2 数字声音及应用5.3 图像与图形 5.5 数字视频及应用,5.1 文本与文本处理,5.1.1 字符的编码5.1.2 文本的获取5.1.3 文本的常见格式,文字处理是计算机应用的基础,计算机应用使用计算机进行信息处理,其中,文字信息处理是涉及面最广的一种计算机应用,几乎与任何领域任何人都有关。,传统的文字处理过程,计算机文字处理过程,文字信息在计算机中称为“文本”(text),文本是计算机中最常用的一种数字媒体文本由一系列“字符”(character)组成,每个字符均使用二进制编码表示文本在计算机中的处理过程是:,5.1.1.字符编码,字符

2、、字符集及其编码表,文字的基本元素是字母和符号,统称为“字符”(character),它包括:字母、数字、标点、符号等字符集:一组抽象字符的集合,是常用字符的集合不同的字符集包含的字符数目与内容不同,如:中文字符集、西文字符集、日文字符集等字符的编码:字符集中每个字符的二进位表示,称为该字符的编码或代码(code)不同的字符其编码各不相同字符集中所有字符的编码的一览表,称为该字符集的码表,1、ASCII码西文字符的编码,西文是表音文字(拼音文字),它由拉丁字母、数字、标点符号以及一些特殊符号所组成美国标准信息交换码(ASCII码):ASCII字符集包含96个可打印字符和32个控制字符采用7个二

3、进位进行编码计算机中使用1个字节存储1个ASCII 字符存在问题:字符集太小(只有128个字符)不同国家和地区使用不同的字符集及其编码,互不兼容东亚地区使用的大字符集无法编码,2、扩充ASCII字符集,ISO陆续制定了一批适用于不同地区的扩充ASCII字符集,每个扩充ASCII字符集分别可以扩充128个字符,这些扩充字符的编码均是高位为1的8位代码(十进制数128255),称为扩展ASCII码。,3、汉字的编码,汉字是记录汉语(国语,华语)的文字,属于表意文字,它用符号直接表达词或词素,有多个国家和地区使用(中、日、韩、新、马)汉字的特点数量大;字形复杂,同音字多,异体字多如何编码?确定收入多

4、少字、哪些字?在字符集中如何排列?使用多少个二进位进行编码?,常用的汉字编码字符集,国家标准GB2312-1980汉字扩充规范 GBK国家标准GB18030-2005台湾地区的标准汉字字符集CNS 11643(BIG 5,俗称“大五码”)日本工业标准汉字字符集JIS X 0208-90韩国国家标准汉字字符集KSC 5601-87UCS/Unicode多文种大字符集,GB2312汉字编码字符集,1980年颁布信息交换用汉字编码字符集基本集GB2312-1980GB2312字符集由三个部分构成:,拉丁字母、俄文、日文平假名与片假名、希腊字母、汉语拼音等共682个,共6763个汉字和682个符号,每

5、个汉字和符号都有一个确定位置,GB2312汉字的编码,每一个GB2312汉字使用16位(2个字节)表示为了与ASCII字符相区别,每个字节的最高位均为“1”,例如:“南”字的代码是11000100 11001111(用十六进制表示为C4CF),区位码、国标码和机内码,区位码:字符的代码表为9494的表,行号(093)为区号,列号(093)为位号。该字符所在的区号(行号)及位号(列号)的二进制代码(7位区号在左,7位位号在右,共14位)即为区位码。每个汉字在码表中的位置编码,称为区位码。国标码:由于信息传输的原因,汉字的区号和位号必须加上32所得的二进制代码才是其对应的国标码。国标码=(区码+3

6、2,位码+32)机内码:在计算机内部,汉字以两个字节来表示一个汉字,为和ASCII码区别,其最高位为1。该码称为汉字的机内码,又称内码。,区位码、国标码和机内码,注意:区位码是用十进制表示的,国标码是用十六进制或二进制表示的,机内码是用十六进制或二进制表示的,例如“南”字在国标 GB2312(1980)中,排在 36 区 47 位 它的 区位码为 36 47(十进制)在区号、位号上各加上 32 国标码为 68 79(十进制)01000100 01001111 为了避免与 ASCII 码中的字符冲突,在区码和位码上各加 80 H 80 H=10000000 B 加上 80 H 68=010001

7、00 B 11000100 B=C4 H 79=01001111 B 11001111 B=CF H“南”字的机内码为 C4CF H,区位码、国标码和机内码,思考题:“救”的区位码是3040,它的机内码是多少?,解:救的区位码30 40 国标码为62 72 转换成二进制为(00111110 01001000)机内码为(10111110 11001000)也即BEC8H,注意:汉字的区位码和国标码是唯一的、标准的,而机内码的表示则可能随着系统的不同而使用不同的方法。,UCS/Unicode多文种大字符集,背景:为了实现全球数以千计的不同语言文字的统一编码方案:ISO将全球所有文字字母和符号集中在

8、一个字符集中进行统一编码(目前共收集了17x2161,114,112 个),称为UCS/UnicodeUCS/Unicode的编码方案:先实现部分字符的编码(共107,361个字符)尽量与已有编码标准兼容其中包含有中、日、韩统一整理出来的近3万汉字(称CJK汉字)允许有若干不同的编码方案,例如:,GBK汉字内码扩充规范,GB2312的不足:汉字字数太少,缺少繁体字,无法满足人名、地名、古籍整理、古典文献研究等应用的需要;与ASCII码不兼容GBK汉字内码扩充规范(1995):在GB2312基础上,增加了1万多汉字(包括繁体字)和符号共有21003个汉字和883个图形符号,如“計算機”、冃、冄、

9、円、冇等繁体字和生僻字 与GB8312保持向下兼容,也使用双字节表示,第1字节最高位必须为“1”:,GB18030汉字编码标准,背景:无论是Unicode的UTF-8还是UTF-16,其CJK汉字字符集虽然覆盖了我国已使用多年的GB2312和GBK标准中的汉字,但它们的编码并不相同为了既能与UCS/Unicode编码标准接轨,又能保护我国已有的大量汉字信息资源,我国在2000年和2005年两次发布GB18030汉字编码国家标准。GB18030实质上是UCS/Unicode字符集的另一种编码方案:单字节编码(128个)表示ASCII字符双字节编码(23940个)表示汉字,与GBK(以及GB231

10、2)保持向下兼容,GBK不再使用四字节编码(约158万个)用于表示 UCS/Unicode中的其他字符GB18030目前已在我国信息处理产品中强制贯彻执行。,小结:几种汉字编码的对比,例:IE浏览网页时文字编码的选择,繁体汉字的编码标准,BIG5编码是目前台湾、香港地区普遍使用的一种繁体汉字的编码标准BIG5包括440个符号,一级汉字5401个,二级汉字7652个,共计13060个汉字香港增补字符集HKSCS是香港政府订立的BIG5扩展标准,5.1.2.文本的获取,1、文本信息的输入,键盘输入,(1)数字编码,如电报码、区位码等,(2)字音编码,如智能ABC等(3)字形编码,如五笔字形和表形码

11、等,(4)形音编码发展趋势:基于统计和学习功能的以词语(短语)或句子作为输入单位的输入方法,1、文本信息的输入,优点:自然,流畅小型化,适合移动计算不足:识别速度和正确性还需提高书写要求还要降低,1、文本信息的输入,优点:自然,方便,适合移动计算不足:对说话人、说话方式、说话内容的适应能力要大大增强识别速度和正确性还需大大提高,1、文本信息的输入,识别率已达到98%功能:简、繁体字混合识别中文、西文混合识别文字、表格混合识别智能校对功能,1、文本信息的输入,技术上非常困难,还无法实用目前准备先突破工整的楷书手写体的识别!,汉字的键盘输入,汉字与键盘上的键无法一一对应,因此必须使用几个键来表示一

12、个汉字,这就称为汉字的“键盘输入编码”优秀的汉字键盘输入编码应具有的特点:易学习、易记忆效率高(平均击键次数较少)重码少容量大(可输入的汉字字数多),汉字键盘输入方法的比较,2、文本信息的输出,目的:阅读、浏览或打印文本使用的软件:文本阅读器/文本浏览器嵌入在文本编辑(处理)软件中,如微软的Word,独立的软件:如Adobe公司的Acrobat Reader,微软公司的IE等 文本展现的过程:对文本的格式描述进行解释生成文字和图表的映像(bitmap)传送到显示器或打印机输出,输出过程中字形的生成,过程:先根据字符的字体确定相应的字库(font)存放汉字字形的信息库,简称字库。不同的字体(黑体

13、、宋体、隶书)对应不同的字库。字库包括:点阵字库:16*16,24*24,32*32 点阵中“1”对应位置为黑点,“0”对应位置为空白。轮廓字库:用直线曲线勾画轮廓,并以数学函数来描述精度高,字形可任意变化。再按照该字符的代码从字库中取出该字符的形状描述信息然后按形状描述信息生成字形,并按照字号大小及有关属性(粗体、斜体、下横线)将字形作必要的变换最后将变换得到的字形放置在页面的指定位置处,轮廓描述,点阵描述,汉字的处理过程:输入码 汉字输入法 机内码计算机内部处理字库(字型码)输出,附:电子书阅读器,“电子书阅读器”是一种专门用于阅读各种电子文档(如.txt、.doc、.html、.pdf

14、等)的专用硬件设备采用电子墨水显示屏,被动发光,耗电极少,持续工作时间很长(1个月以上)阅读效果接近纸质图书轻薄,便于携带颇有发展前景,5.1.3 文本的常见格式,1、简单文本(纯文本),没有字体、字号的变化,不能插入图片、表格,也不能建立超链接,其文件后缀名是.txt 由一串用于表达正文内容的字符编码所组成,几乎不包含任何其他的格式信息和结构信息,2、丰富格式文本,本书由高等教育出版社(Higher Education Press)出版,有字体字号等属性变化、设置了段落和页面排版格式的文本称为“丰富格式文本”丰富格式文本中,除了正文内容之外,还使用了许多“标记”来描述字符的属性和格式的设置。

15、举例:下面标题的格式为:中文用黑体,西文用Arial Black体,居中,使用HTML语言描述为:,本书由高等教育出版社(Higher Education Press)出版,用一对指出的是标记,如 和 等,用于说明排版的格式和文字属性,它们不属于正文内容,正文内容,3、超文本,若干文本或文本中的各个部分可按照其内容的关系互相链接起来,从而形成“超文本”,“超链”实际上就是一个指针,用于指向其他文本块,也可以指向同一文本块中的其他部分,超链是有向的,起点位置称为链源,它可以是文本块中的一个标题、一句句子、一个关键词、一幅画、一个图标等,文本块可以是一个网页,一个文档,一段文字,也可以是一张图片,

16、甚至一段声音或视频,4、超媒体的概念,超媒体可以包含文字、图形、图像、动画、声音或影视片段等媒体,而这些媒体之间也是用超级链接组织的超媒体和超文本之间的不同是:超文本主要是以文字的形式表示信息,建立的链接关系主要是文句之间的链接关系超媒体除了使用文本外,还使用图形、图像、声音、动画或影视片段等多种媒体来表示信息,建立的链接关系是这些媒体之间的链接关系,小结:文本的分类,5.2 数字声音及应用,5.2.1 数字声音的获取5.2.2 声音的常见格式5.2.3 声音的编辑5.2.4 计算机合成声音,5.2.1 数字声音的获取,声音的特性和类型,声音由振动产生,通过空气进行传播声音是一种波,它由许多不

17、同频率的谐波组成谐波的频率范围称为声音的“带宽”,计算机处理的声音类型:话音或语音(speech),专指人的说话声音,带宽仅为3003400Hz全频带声音(如音乐声、风雨声、汽车声等),其带宽可达到20Hz20kHz 人耳可听到的声音统称“可听声”(audio),20Hz20kHz,模拟信号和数字信号,模拟信号是一种指时间和幅度上都连续的信号。数字信号指一个数据序列,是把时间和幅度都用离散的数字表示的信号。它来源于模拟信号,是模拟信号的一个子集,是对模拟信号经采样(时间离散化)、量化(幅值离散化)、编码(可能压缩)而得到的近似表示模拟信号的数据序列。,声音信息数字化,步骤:,2.量化(quan

18、tization,模数转换),3.编码(encoding),1.取样(sampling),相关概念及定律,采样定律:fs2f 意思是如果采样频率fs2倍的采样信号最高频率,就可以根据所采样本还原出原来的声音,实现无损数字化(Lossless digitization)。采样精度:由表示样本时所采用的二进制位数决定,如样本用16位表示,样本数据值则是065535中的一个数字,精度就是1/65536。,数字声音的参数,数字声音的主要参数有:取样频率:语音的取样频率低,一般为8k 16k Hz全频带声音(如音乐)取样频率高,一般为44.1k 48k Hz量化位数:通常为8位、12位或16位声道数目:

19、单声道为1,双声道为2码率(比特率),每秒钟的数据量,数字声音数据率(即码率)的计算,未压缩时数字波形声音的码率计算公式 数据率=采样频率 量化位数 声道数 例:,压缩编码之后数字波形声音的码率为:压缩后的码率=未压缩时的码率/压缩倍数,声音信息的计量,一个声音文件如不采用压缩技术,文件大小为 文件的字节数=数据率时间8=采样频率量化位数 声道数时间8其中:采样频率单位是Hz,量化位数单位是bit,时间单位是秒。例:一个声音文件中的声音取样频率为44.1kHz,量化位数8位,声道数2,声音播放时间为1分钟,不采用压缩技术,请估计该文件约有多大?441008260 85292000B,补充:数字

20、波形声音的获取设备,声音的联机获取设备(声卡),声波转换为电信号,声音的脱机获取设备:数码录音笔,取样、量化和编码,补充:声音的重建与播放,计算机输出声音分为两步:1 声音的重建:把声音从数字形式转换成模拟信号形式,由声卡完成,2 声音播放:将模拟声音信号经处理和放大后送到音箱(扬声器)关于音箱:普通音箱接收的是重建的模拟声音信号数字音箱直接接收数字声音信号,失真更小,补充:声卡的几种类型,硬声卡:除CODEC芯片外,主板上还有1块音频主处理芯片,很多音效处理任务无需CPU参与就可独立完成,声卡的类型,独立声卡:以扩展卡形式插在机箱中使用,集成声卡,软声卡:主板上仅1块CODEC芯片,负责取样

21、与量化处理,I/O控制器部分集成在主板上的南桥芯片中,DSP的功能需由CPU协助完成,声卡的组成部分均集成在主板上,2、声音信号数字化的优点,声音重放性能好,复制时没有失真可编辑性强,易于进行效果处理能进行数据压缩,传输时抗干扰能力强容易与其他媒体相互结合(集成)为自动提取“元数据”和实现基于内容的检索创造了条件,5.2.2 声音的常见格式,声音的常见格式,1、WAV文件,即波形文件,是微软专门为Windows设计的波形文件存储格式。文件扩展名:.WAV 获取过程:采样+量化+编码 缺点是:文件太大 适用于所有声音,2、CD文件,CD是光盘的一种存储格式,专门用来记录和存储音乐。文件扩展名:.

22、cda,这只是一个索引信息,并不是真正的包含声音信息 标准CD格式的采样频率为44.1KHz,速率88K/秒,16位量化位数。优点:可提供高质量的音源,而且无须硬盘存储声音文件,声音直接通过光盘由CD-ROM驱动器中特定芯片处理后发出,被称为音质最好的音频格式。,3、MIDI文件,MIDI(Musical Instrument Digital Interface):乐器和计算机等电子设备之间交换信息与控制信号的一种标准协议。文件扩展名:.MID.RMI文件内容:是指令集,指示MIDI设备发出规定的演奏音符、决定演奏多长时间、音量的变化和生成音响效果等。优点是:文件小,容易编辑,是几乎所有多媒体

23、创作软件都支持的背景音乐格式。仅适用于音乐。,4、MP1/MP2/MP3文件,MPEG音频文件指MPEG(Moving Picture Expert Group活动图像专家组)标准中的声音部分即MPEG音频层。MPEG Audio Layer 1/2/3 分别与MP1、MP2和MP3这三种声音文件对应。MP1和MP2的压缩率分别为4:1和6:18:1。MP3的压缩原理主要是抛弃人类无法辨识的那部分声音,压缩比一般可达到1:101:12。MP3文件扩展名:.mp3一首30M的WAV格式的歌曲,转换成MP3格式,文件大小仅3M左右。,所谓“MP3音乐”,它是一种采用MPEG-1层3编码的高质量数字

24、声音,压缩比大约1012倍,使一张普通CD光盘上可以存储大约100首MP3歌曲,可连续播放10小时。,5、MP4文件,MP4是一个商标的名称,采用美国电话电报公司所研发的采用“知觉编码”的a2b音乐压缩技术MP4文件扩展名:.MP4压缩率一般为15:1,最高可达到20:1,且不影响音乐的实际听感MP4在加密和授权方面也做了特别设计,能有效保护版权,6、WMA(Windows Media Audio)文件,WMA格式是由微软公司开发的流式声音文件,以减少数据流量但保持音质的方法来达到比MP3压缩率更高的目的文件扩展名:.wmaWMA的压缩率一般都可以达到1:18左右WMA的优点:提供商可以加入防

25、拷贝保护支持音频流(Stream)技术,适合在网络上在线播放只要安装了Windows操作系统就可以直接播放WMA音乐相比较而言MIDI格式的文件最小,WMA格式的文件比较小,MP3格式的文件最大,但是音质也是最好的。,7、Real Audio文件,Real Audio主要适用于在网络上的在线音乐欣赏文件格式:.RA(RealAudio)、.RM(Real Media,RealAudioG2)、.RMX(Real Audio Secured)等优点:可以随网络带宽的不同而改变声音的质量,在保证大多数人听到流畅声音的前提下,令带宽较富裕的听众获得较好的音质。,8、VOC文件,Voice文件是新加坡

26、著名的多媒体公司Creative Labs开发的声音文件格式多用于保存Creative Sound Blaster系列声卡所采集的声音数据与WAV文件的结构相似,可以通过一些工具软件方便的互相转换,5.2.3 声音的编辑,声音编辑软件的功能,主要功能:1 编辑声音:如声音剪辑、复制、调节音量2 声音的效果处理:如混响、回声、淡入、淡出等3 录音4 声音的格式转换5 播放声音,声音编辑软件的典型用户界面,常用音频处理软件,录音机:可录制和编辑WAV文件媒体播放机(Media Player):可用于播放当前最流行格式的音频、视频和混合型多媒体文件。豪杰音频解霸3500:是一款同时具有压缩、解压缩功

27、能的万能音频播放器,具有卡拉OK功能,对于MTV或具有立体声的音乐,软件可以将原唱消除,从而用于卡拉OK,此外还具有读TXT文本文件的功能。千千静听:适用于听音乐,支持同步歌词滚动显示和拖动定位播放,并且支持歌词下载和歌词编辑功能。最大优点就是可以转换文件格式,它几乎支持将所有音频格式转换到WAVE、MP3、APE、WMA等格式。其他播放器软件:网上在线收听用的RealPlayer、专门播放MP3的Winamp、专用音频编辑软件Gold Wave、Cool Edit和全能音频转换通。,5.2.4 计算机合成声音,什么是计算机合成声音?,计算机合成声音就是计算机模仿人说话或演奏音乐计算机合成声音

28、有两类:计算机合成语音:计算机模仿人把一段文字朗读出来,即把文字转换为说话声音(简称为 TTS)应用:有声查询、文稿校对、语言学习、语音秘书、自动报警、残疾人服务等计算机合成音乐:计算机模拟各种乐器发声并按照乐谱演奏音乐应用:计算机作曲、配器等,1、语音合成,2、音乐合成,MIDI的优点:数据量极小(比CD立体声少3个数量级,比MP3少3个数量级)易于制作和编辑修改可以与波形声音同时播放MIDI的不足:只能合成音乐,不能合成歌曲和语言音质与硬件设备相关,5.3 图像与图形,5.3.1 数字图像的获取5.3.2 图像的属性与常见格式5.3.3 图像处理与应用5.3.4 医学图像处理5.3.5 计

29、算机图形5.3.6 数字化虚拟人,位图图像和矢量图图像,位图(Bit Mapped Image):也叫点阵图、位映射图像,对应位图文件,是描述图像的一种方法,该方法先把图像切割成许许多多的像素,然后用若干二进制位描述每个像素。适用于所有图像的表示。矢量图(Vector Based Image):用一系列计算机指令来表示一幅图,如画点、画直线、画曲线、画圆、画矩形等。是表示图像的另一种方法,对应图形文件,相当于先把图像切割成基本几何图形,然后用很少的数据量分别描述每个图形。,位图和矢量图比较,位图文件占据的存储空间大;在放大时,位图文件可能由于图像分辨率固定,而变得不清晰;而矢量图采用数学计算的

30、方法,无论怎么将它放大,它都是清晰的;矢量图不好获得;而位图获得的方法就很多;在运行速度上,对于相同复杂度的位图和矢量图来说,显示位图比显示矢量图要快,因为矢量图的运行需要计算。,5.3.1 数字图像的获取,1、图像采集,从数字化的图像库中获取利用计算机图像生成软件制作利用图像输入设备采集从网络上获取,2、图像信息数字化,将画面划分为 M N个网格,每个网格称为 一个取样点,将彩色图像取样点的颜色分解成R,G,B三个基色,测量每个取样点的每个分量(基色)的亮度值,对取样点每个分量的亮度值进行A/D转换,使用数字整型量表示,2、图像信息数字化,与声音信息数字化一样,图像信息数字化的过程也是通过采

31、样和量化得到的,只不过图像的采样是在二维空间中进行的。,5.3.2 图像的属性与常见格式,图像的属性之分辨率,分辨率是影响图像质量的重要因素,可分为屏幕分辨率和图像分辨率两种。屏幕分辨率:指计算机屏幕上最大的显示区域,以水平和垂直的像素表示。屏幕分辨率和显示模式有关,例如在VGA显示模式下的分辨率是1024768,是指满屏显示时水平有1024个像素,垂直有768个像素。图像分辨率:指数字化图像的尺寸,是该图像横向像素数纵向像素数,决定了位图图像的显示质量。如一幅320240的图像,共76800个像素。,举例:分辨率与图像尺寸的关系,520 x376,260 x188,130 x94,在显示比例

32、相同时,显示在屏幕上的图像尺寸与图像分辨率成正比,图像的属性之像素深度,像素深度是指存储每个像素所用的位数,一般指表示像素的颜色值所用的二进制的位数。图像的颜色数2像素深度,如黑白图的像素深度是1,灰度图的像素深度是8,真彩色图的像素深度是24。,图像的属性之颜色模型,颜色模型(又称为色彩空间)指彩色图像所使用的颜色描述方法。常用颜色模型有RGB(红、绿、蓝)、CMYK(青、品红、黄、黑)、HSV(色彩、饱和度、亮度)、YUV(亮度、色度)等。根据不同的需要,可以使用不同的颜色模型来定义颜色。RGB模型是最常见的一种颜色模型,它使用红(Red)、绿(Green)、蓝(Blue)三种基色来生成所

33、有其他的颜色,每种颜色由红、绿、蓝按不同的强度比例合成,主要用于显示器系统;HSV模型(Hue色度,Saturation饱和度,Value亮度),即HSI(Hue色度,Saturation饱和度,Intensity亮度)颜色空间,从人的视觉系统出发,用色度、色饱和度和亮度来描述色彩,比RGB色彩空间更符合人的视觉特性。在印刷业上则采用CMYK模型,它使用青蓝色(Cyan)、洋红(Magenta)、黄色(Yellow)和黑色(Black)四种彩色墨水来打印像素点。,图像的属性之图像文件的大小,一幅图像的大小与图像分辨率、像素深度有关,可以用以下公式来计算:图像文件的字节数=每像素所占位数(即像素

34、深度)行像素数列像素数8其中,图像颜色数=2每像素所占位数。例如,一幅图像分辨率为640480,像素深度为24的真彩色图像,未经压缩的大小为,几种常用格式的图像的大小:,例:数字图像传输时间的计算假设数据传输速率为56 kb/s(电话上网),则传输一幅分辨率为640480的6.5万种颜色的未压缩图像的最小时间为:(640 x480 x16)/56000=87.8秒,补充:数字图像的数据压缩,图像数据压缩的必要性:节省存储数字图像所需要的存储器容量提高图像的传输速度,减少通信费用 图像数据压缩的可能性:数字图像中有大量的数据冗余人眼视觉有局限性,允许图像有一些失真图像数据压缩的两种类型:无损压缩

35、:用压缩后的数据还原出来的图像没有任何误差有损压缩:用压缩后的数据还原出来的图像有一定的误差压缩编码方法的评价,2、图像文件的常见格式,不同的图像文件格式采用了不同的数据压缩技术和数据组织方法,有不同的应用常用的图像文件格式有:,(1)BMP格式,BMP图像格式是Windows操作系统下使用的一种标准图像格式支持单色、16色、256色、真彩色图像一个文件一幅图像,可以进行无损压缩,也可不压缩非压缩的BMP文件是一种通用的图像文件格式,几乎所有Windows 应用软件都能支持,(2)GIF 格式,颜色数目不超过256色,适合用作插图、剪贴画等色彩数要求不高的场合,文件特别小,适合网络传输GIF图

36、像格式具有累进显示功能,适合网络浏览器观看 GIF图像格式能支持透明背景(JPEG不支持)GIF图像格式能支持动画,透明背景,(3)JPEG格式,JPEG是静止图像数据压缩编码的国际标准,采用JPEG标准的图像文件扩展名是.jpgJPEG特别适合各种连续色调的彩色或灰度图像,在计算机和数码相机中已得到广泛应用 JPEG的最新标准是JPEG2000(图像文件扩展名是.jp2),它采用更先进的技术,可取得更好的效果,目前在医学图像处理中使用,5.3.3 图像处理与应用,1、数字图像处理的概念,数字图像处理是指使用计算机对来自照相机、摄像机、传真机、扫描仪、医用CT机、X光机等的图像,进行去噪、增强

37、、复原、分割、提取特征、压缩、存储、检索等操作处理。,2、数字图像处理的目的与方法,目的:(1)提高图像的视觉质量(2)恢复与重建有失真和畸变的图像(3)图像分析,包括:图像的分类、识别和理解等(4)图像数据的变换、编码和数据压缩(5)图像的存储、管理与检索(6)图像内容与知识产权的保护 方法:编码压缩、图像增强、图像恢复、图像编辑、图像格式转换、去噪、分割、提取特征、存储、检索等。,数字图像处理的应用,图像通信,包括图像传输、电视电话、电视会议等。遥感医疗诊断工业生产中的应用,如产品质量检测,生产过程自动控制等机器人视觉军事、公安、档案管理等其他方面的应用,X光图像,CT图像,核磁共振图像,

38、指纹图像,3、常用图像编辑软件,Word和PowerPoint具有基本的图像编辑功能Windows附件中的“画图”软件微软Office工具中的Picture ManagerACD System公司的ACDSee32Adobe PhotoShop,5.3.4 医学图像处理,next,什么是医学图像处理,医学图像处理就是利用计算机系统对生物医学图像进行的具有临床医学意义的处理和分析,是一门综合了数学、计算机科学、医学影像学等多个学科的交叉科学,是利用数学的方法和计算机这一现代化的信息处理工具,对由不同的医学影像设备产生的图像按照实际需要进行处理和加工的技术。,医学图像处理的主要方法,1、几何处理:

39、包括坐标变换,图像的放大、缩小、旋转、移动、图像配准、畸变校正、扭曲校正和周长、面积、体积计算等。如:超声图像的几何处理,2、算术处理,算术处理主要对图像施以、等运算,该处理主要针对像素点,如:医学图像的减影处理,3、图像增强,突出图像中感兴趣的信息,主要方法有直方图增强、伪彩色增强法和灰度窗口等技术。如:直方图增强和伪彩色增强。直方图增强 伪彩色增强,4、图像分割,是指把图像分成各具特征的区域,并提取感兴趣目标的技术和过程。主要用途:用于图像配准、融合人体组织、器官和病灶的定量测量三维可视化数据压缩和传输,5、图像复原,主要目的是去除干扰和模糊,恢复图像的本来面目主要方法:维纳滤波逆滤波同态

40、滤波,6、图像重建,二维图像重建主要算法有:代数法迭代法傅立叶反投影法卷积反投影法三维图像重建,如下图:,7、图像编码,目的:减少数据存储量降低数据率以减少传输带宽压缩信息量,便于特征提取,为识别做准备医学图像常用的静态图像格式有:BMPJPGTIFDICOM 其中DICOM属于原始数据格式,没有任何失真,其他格式会造成一定信息的丢失,但不影响诊断质量,8、图像理解,即景物理解,输入的是图像,输出的是一种描述。不仅是单纯的用符号做出详细的描绘,而且要利用客观世界的知识使计算机进行联想、思考及推论,从而理解图像所表现的内容。,5.3.5 计算机图形,什么是计算机图形(graphics),通过计算

41、机和软件对景物的结构、形状与外貌进行描述(称为“建模”),然后根据该描述和选定的观察位置及光线状况,生成该景物的图形(称为“绘制”或“图像合成”)计算机图形也称为计算机合成图像计算机制作图形的步骤如下:,补充:景物的2种描述(建模)方法,补充:计算机图形的绘制过程,从景物模型绘制出图形的过程,实际上也是把景物的描述(模型)转换成为点阵(像素阵列)的过程,它包括下列步骤:,将各个物体的所有表面用小的多边形(三角形或四边形)进行近似表示,用户选择一个观测位置,并设定一个取景范围,将景物向成像平面作透视投影;然后将景物中不在取景范围内的部分裁剪掉,同时还把景物中所有被遮挡而看不见的部分隐去,根据景物

42、表面材料的性质和环境光源的设定,计算出物体可见面上每一点(像素)的颜色及其亮度,计算出物体所产生的本影和半影;根据景物表面和背景使用的材料,选择合适的纹理映射到物体的表面,美国康乃尔大学Suzanne Smits 和Priamos Georgiades建模并绘制的俄罗斯茶壶,例1:俄罗斯茶壶,例2:计算机绘制的钢笔画和铅笔画,木 桶,玻璃瓶,引用自:Georges Winkenbach,D.Salesin(Univ.of Washington)pp.469-476,SIGGRAPH96,补充:显卡在绘制过程中起重要作用!,图形绘制过程中,每个像素的颜色及其亮度都要经过大量计算才能得到,因此绘制

43、过程的计算量很大,特别是三维图形和动画目前PC机所配置的显卡(图形卡)上安装了功能很强的专用绘图处理器(GPU),它承担了绘制过程中的大部分计算任务,计算机图形的应用,(1)计算机辅助设计和辅助制造(CADCAM)。(2)利用计算机生成各种地形图、交通图、天气图、海洋图、石油开采图等。(3)作战指挥和军事训练。(4)计算机动画和计算机艺术。(5)其它:电子出版、数据处理、工业监控、辅助教学、软件工程等。,矢量绘图软件,专业绘图软件:AutoCAD、PROTEL和CAXA电子图板(机械、建筑等)MAPInfo、ARCInfo、SuperMap GIS(地图、地理信息系统)办公与事务处理、平面设计

44、、电子出版等使用的绘图软件:Corel公司的CorelDraw,Adobe 公司的Illustrator,Macromedia公司的FreeHand,微软公司的Microsoft Visio等MS Office中内嵌的绘图软件:Word 和 PowerPoint中的绘图功能(简单的二维图形),小结:图像与图形的对比,5.3.6 数字化虚拟人,什么是数字化虚拟人,数字化虚拟人是通过数字技术模拟真实的人体器官而合成的三维模型。这种模型不仅具有人体外形以及内脏等各个器官的外貌,而且具备各器官的新陈代谢机能,能较为真实的显示出人体的正常生理状态和出现的各种变化。数字化虚拟人是虚拟可视人、虚拟物理人和虚

45、拟生物人的统称。最早在1989年由美国提出“虚拟可视人”的概念,目前日本、韩国和中国都启动了“虚拟人”计划。获取“虚拟可视人”的数据,一般采用人工断层解剖学的方法,如图:厚度为0.1毫米的人体首组切片。,虚拟人的应用前景,医学参考制药实验军事应用肿瘤治疗体育运动,5.5 数字视频及应用,5.5.1 数字视频基础5.5.2 数字视频的常见格式5.5.3 数字视频的编辑5.5.4 计算机动画,5.5.1 数字视频基础,相关术语,1、视频:广义上是指可视的信息,包括静止图像和动态图像。通常情况下,活动的图像序列成为视频。人们所看到的视频信息都是由许多幅图像序列组成,如:电影、电视、影碟等都是视频信号

46、。2、帧:视频中的每一幅图像3、数字视频(视频信号数字化):数字视频是指在一段时间内,以一定的速率对模拟视频进行捕获,并加以采样、量化等处理后所得到的媒体数据。4、帧频率:又称为帧速,即每秒钟播放的帧的数目。根据帧频率的不同,视频制式有30帧/秒(NTSC)、25帧/秒(PAL)两种。5、PAL制式和NTSC制式:PAL制式:中国、中东地区和欧洲使用的电视系统制式,帧频率25NTSC制式:美国、日本、加拿大和墨西哥使用的电视系统制式,帧频率30 以上二者帧频率都25,PAL和NTSC制式的分辨率不同,PAL制式使用的是720576,而NTSC制式使用的是760480,5.5.2 数字视频的常见

47、格式,补充:目前流行的数字视频编码标准,视频文件的常见格式,AVI(Audio Video Interleaved音频视频交错)格式:分非压缩和压缩两种,前者通用性很好,但文件庞大,后者压缩比大时,画面质量不太好。ASF(Advanced Streaming Format)格式:由Microsoft公司推出的一种高级流媒体格式,是一个可以在Internet上实现实时播放的标准,可以直接使用Windows自带的Windows Media Player对其进行播放。压缩率和图像质量都很不错,可以应用于互联网上的视频直播(WebTV)、视频点播(VOD)、视频会议等。,视频文件的常见格式,RM(Re

48、al Media)格式:是Real Networks公司开发的一种流媒体视频文件格式,主要包含Real Audio、Real Video和Real Flash三个部分。可根据网络数据传输的不同速率制定不同的压缩比率,从而实现在低速率的Internet上进行视频文件的实时传送和播放,在互联网上得到了广泛的应用。RMVB格式:是一种由RM视频格式升级延伸出的新视频格式,在保证了静止画面质量的前提下,大幅提高了运动图像的画面质量。,视频文件的常见格式,MOV格式:原是QuickTime for Windows的专用文件格式,也使用有损压缩技术,音频视频混排,一般认为较AVI格式图像质量好。DAT格式

49、:是VCD及卡拉OK CD专用的视频文件格式,也采用MPEG压缩、解压缩。如果计算机配备视频卡或安装解压缩程序如超级解霸就可播放。FLIC格式:采用的是无损压缩,画面效果最好,在人工或计算机生成的动画方面使用该格式较多。播放该格式文件需要Autodesk公司的MCI(多媒体控制接口)驱动和相应的播放程序AAPlay。,视频文件的常见格式,MPEG格式:是计算机上的全屏幕运动视频标准文件格式,目前已日益普及。该格式文件使用MPEG压缩,可用于1024768分辨下,以帧频24、25或30播放有128000种颜色的全屏幕运动视频图像,并配以CD音质的伴音信息。DivX格式:是由MPEG-4衍生出的另

50、一种视频编码(压缩)标准,也即通常所说的DVDrip格式,它采用了MPEG-4的压缩算法,同时又综合了MPEG-4与MP3各方面的技术,其画质媲美DVD且体积只有DVD的数分之一。WMV格式:(Windows Media Video)是微软推出的一种采用独立编码方式并且可以直接在网上实时观看视频节目的文件压缩格式。,5.5.3 数字视频的编辑,、常用播放软件,Windows自带的Media Player媒体播放机:用于接收目前流行的音频、视频及混合型多媒体文件,还支持流媒体文件的播放(.asf)RealPlayer播放器:是一个网上在线收听收看实时音频、视频和Flash动画的最佳工具 暴风影音

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 建筑/施工/环境 > 农业报告


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号