《信息、数据与计算机表.ppt》由会员分享,可在线阅读,更多相关《信息、数据与计算机表.ppt(48页珍藏版)》请在三一办公上搜索。
1、,西华大学,2,第2章 信息、数据与计算机表示,2.1进位计数制2.2 字符信息的表示方法 2.3 多媒体信息表示 2.4 多媒体信息的压缩技术,3,2.1.1 数字化信息编码的基本概念信息编码:使用尽可能少的基本符号的排列组合来表示大量的复杂多变的信息的方式称为信息编码。计算机采用二进制的优点是:1在物理电路上相对其它码来说最容易实现。2运算规则简单。3二进制数据可方便地进行逻辑运算。,2.1 进位计数制,4,2.1.2 进位计数制 在计算机内部,信息广泛采用二进制形式表示,有时还会使用十进制、八进制、十六进制。1基本概念 数码(数字符号)例:(16进制)0,1,2,3,4,5,6,7,8,
2、9 A,B,C,D,E,F(R进制)0,1,2,R-1 基数:计数制中所能用到的数码个数R。运算时“逢R进一”,故称R进制(进位制的概念)。位权值:计数中每一位所表示的数值大小。,2.1 进位计数制,5,2在进位制中,数A的一般写法:3练习:写出8进制数的基数,位权,数字符号,2.1 进位计数制,基数,权,数码,6,常用的进位计数制:P44表2-1,十进制 R=10,可使用0,1,2,3,4,5,6,7,8,9二进制 R=2,可使用0,1 八进制 R=8,可使用0,1,2,3,4,5,6,7 十六进制R=16,可使用0,9,A,B,C,D,E,F,“逢R进一,借一当R”,2.1 进位计数制,D
3、,B,Q,H,注意:各种进制数的书写表示方法,7,2.1.3 不同的进位数制之间的转换1.R进制数转换为十进制实现把任意R进制的数转换成人们习惯的十进制数,可清楚地看到这个数实际大小。,2.1 进位计数制,8,(1)十进制数制,主要特点:,有十个不同的计数符号:0、1、2、3、4、5、6、7、8、9,故其基数为10;按“逢十进一”的规则进行计数。,例:666.66=,610261016100610-1610-2,2.1 进位计数制,9,(2)二进制数制,主要特点:,仅有两个不同的计数符号:0和1,其基数为2;,例:(101101.11)2=,12502412312202112012-112-2
4、,=,=,32+0+8+4+0+1+0.5+0.25,(45.75)10,按“逢二进一”的规则计数。,方法:按权相加法(基权展开式求和法),转换为十进制数。,2.1 进位计数制,10,(3)八进制数制,主要特点:,有八个不同的计数符号:0、1、2、3、4、5、6、7,其基数为8;,例:(642)8=682+481+280=(418)10,按“逢八进一”的规则计数。,转换为十进制数。,2.1 进位计数制,11,(4)十六进制数制,主要特点:,有16个不同的计数符号:0、1、2、3、4、5、6、7、8、9、A(10)、B(11)、C(12)、D(13)、E(14)、F(15),其基数为16位;,例
5、:(9B4.4)16=,按“逢十六进一”的规则计数。,9162+11161+4160+416-1,=,(2484.25)10,转换为十进制数。,2.1 进位计数制,12,2.十进制转换成R进制整数部分:采用的是“除R取余法”,即把整数不断地整除R(R是目标进制),每整除一步都要取出余数,让商再次整除R,直到商为0,最后按取余的顺序反向排列各步的余数即可。小数部分:采用的是“乘R取整法”,即把小数不断地乘以R,每乘一步都要取出乘积的整数部分,让余下的小数部分再次乘以R,直到乘积为0(如达不到0,则可取有限步),最后按取整的顺序正向排列各步取得的整数即可。,2.1 进位计数制,13,十进制转换为二
6、进制,十进制整数转换为二进制整数“除2取余”,十进制小数转换为二进制小数“乘2取整”,带整数和小数的二进制数转换为十进制数 由方法一和方法二综合组成。,2.1 进位计数制,14,1 3,6,3,1,0,2,2,2,2,余数,1,0,1,1,二进制数低位,二进制数高位,例1:(13)10=()2,2.1 进位计数制,15,1101,例1:(13)10=()2,1 3,6,3,1,0,2,2,2,2,余数,1,0,1,1,二进制数低位,二进制数高位,2.1 进位计数制,16,(0.6875)10=()2,0.6 8 7 5,2,3 7 5 0,1.,2,7 5 0,2,0.,5 0,1.,2,0,
7、1.,整数,1,0,1,1,二进制数高位,二进制数低位,例2:,2.1 进位计数制,17,例2:(0.6875)10=()2,0.6 8 7 5,2,3 7 5 0,1.,2,7 5 0,2,0.,5 0,1.,2,0,1.,整数,1,0,1,1,二进制数高位,二进制数低位,0.1011,2.1 进位计数制,18,2.1 进位计数制,19,1位八进制数相当于3位二进制数 1位十六进制数相当于4位二进制数,3.二、八、十六进制的相互转换,2.1 进位计数制,(1011010.10)2=,(001 011 010.100)2,=(132.4)8,(1011010.10)2=,(0101 1010.
8、1000)2,=(5A.8)16,(1111 0111)2,=(11110111)2,(F7)16=,八、十六进制与二进制数的关系与转换,20,2.1 进位计数制,21,八进制与十六进制的相互转换:可利用二进制作为转换的中间媒介,把八进制(或十六进制)数与转换为二进制数,再把二进制数转换成十六进制(八进制)数。,2.1 进位计数制,例:把712.56Q转换成十六进制数,22,2.1.4 二进制数的运算 计算机中二进制数的运算分为算术运算和逻辑运算。1二进制数的算术运算 下面仅介绍二进制数的加、减、乘、除运算。加法运算法则为:0+0=0 1+0=0+1=1 1+1=10(逢2进1),例2.11:
9、1001B+11101B=100110B,2.1 进位计数制,23,减法运算法则为:0-0=1-1=0 1-0=1 10-1=1(向高位借1当2),例2.12:11101B-1011B=10010B,2.1 进位计数制,24,乘法运算法则为:00=0 10=0 01=0 11=1(仅当两位都是1时,结果才为1),例2.13:101B110B=11110B,2.1 进位计数制,25,除法运算法则为:01=011=110(无意义,因分母为0),例2.14:101010B10B=10101B,2.1 进位计数制,26,二进制数的逻辑运算,1854年,英国数学家布尔提出用符号表达语言和思维逻辑的思想.
10、20世纪发展为一种现代数学方法,叫做逻辑代数或布尔代数。一.逻辑数据的表示:逻辑变量:用二进制的1和0来表示逻辑上的真与假,对与错,有与无等,这种具有逻辑性的变量称为逻辑变量。逻辑运算的特点:逻辑运算是以二进制为基础的.逻辑运算都是按位进行的,27,二进制数的逻辑运算,二.逻辑运算 逻辑变量之间的运算就称为逻辑运算.逻辑运算(与 AND、或 OR、非NOT),28,数据与信息的概念1数据数据就是对客观事物的符号表示,泛指一切能被计算机接受、加工处理的符号的总称。从广义上讲,数据的含义极为广泛,如数字、文字、图象、声音等都可以通过编码而归于数据的范畴。2信息信息是指数据经过加工处理后得到的有价值
11、的知识。生活中,商品的价格表、一幅中国地图、一段新闻录像、一个手机的响声都是信息,它们都向人们传递着关于特定事物的知识。,2.2 字符信息的表示方法,29,信息的量化1 位(bit)位是计算机内最小的信息单位,它是一个二进制数符0或1所占的存储空间大小,可用字母“b”表示。2 字节(Byte)字节是度量数据存储空间容量的最基本的单位,也常常被认为是计算机最基本的信息单位。计算机的主存储器是以字节为单位来编址的。1 Byte=8 bit(或1B=8b)取210=1024来作为计算机中的“千”:1 KB=1024 B 1 MB=1024 KB 1 GB=1024 MB 1 TB=1024 GB,2
12、.2 字符信息的表示方法,30,3字和字长 同一种计算机一次操作所能处理的固定长度的二进制串就是字,二进制串的位数称为字长。如:奔腾计算机为64位机,它一次能处理64位二进制数据(一个字),也就是字长为64。字长是计算机性能的一个重要指标:字长决定了计算机一次运行数据的吞吐量,字长越长,在相同的时间内能完成处理更多的信息;字长越长,数值运算的精度越高;字长越长,系统支持的指令数量越多,计算机性能越高;字长越长,可寻址的存储空间容量也就越大。,2.2 字符信息的表示方法,31,2.2.3 计算机中数的表示方法,计算机中的数据:,计算机中机器数的有关概念 在机器内以二进制形式存放的数称为机器数。(
13、连同符号一起用二进制形式表示的数)把机器外用正、负号表示的数称为真值数。,数值型数据:128,(32.56)8;,非数值型数据:“教师”、“女”、“028-81789518”。,2.2 字符信息的表示方法,32,小数点的表示方法,在计算机中表示数值型数据,其小数点的位置总是隐含的。,数的符号,一般用数的最高位(左边第一位)来表示数的正负号,并约定以“0”表示正,以“1”表示负。,2.2 字符信息的表示方法,在计算机中,数的长度按比特(bit)来计算。但因存储容量常以“字节”为计量单位,所以数据长度也常以字节为单位计算。机器数的位数是固定的。所能表示的范围受到字长和数据类型的限制。,数的长度,3
14、3,数的定点表示:将计算机中的小数点的位置视为是固定不变的。,定点整数,格式:,定点小数,格式:,(2n-1)(2n-1),2.定点数表示方法,2.2 字符信息的表示方法,范围:,(1 2-(n-1)(1 2-(n-1),34,3.浮点数的表示方法,格式:,阶码是指数部分的值,表示幂次,其基数通常取2。,X=+d 2+E,例如:256.5 的浮点格式(32位)为:,转换(256.5)10=,(0.1000000001)229,阶码:7位,数符,尾数:23位,阶符,2.2 字符信息的表示方法,个字节保存,35,(1)原码,原码就是用最高位表示数的正、负号,0表示正,1表示负,而其他各位表示真值数
15、的绝对值。,(2)反码,原码变反码的规则为:正数的反码与原码相同;负数的反码是将它的原码除符号位外逐位取反。,4.原码、反码、补码,例:二进制数+1000110的原码表示为:,二进制数 1000110的原码表示为:,2.2 字符信息的表示方法,01000110,11000110,36,(3)补码,补码的取码原则是:正数的补码和其原码相同;负数的补码是它的原码除符号位外逐位取反(即0变1,1变0),最后在末位加1。,例:二进制数+1000110的补码表示为:,二进制数 1000110的补码表示为:,二进制数 1000110的反码表示为:,例:二进制数+1000110的反码表示为:,2.2 字符信
16、息的表示方法,01000110,10111001,01000110,10111010,37,原码、补码的几个练习:,十进制 原 码 补 码,87-87 127-127 0-0,01010111,01010111,11010111,10101001,01111111,01111111,11111111,10000001,00000000,00000000,10000000,00000000,采用补码来表示正、负整数时,+0 和 0 的取码是完全相同的,而原码对+0和 0 的取码是不相同的。补码可比同样位数的原、反码多表示一个负数。,2.2 字符信息的表示方法,38,常用计算机信息编码计算机只能识
17、别二进制数据,而人们在日常生活中使用是数值、文字和符号等,为了让计算机能接收和处理日常生活中的这些内容,就必须给这些数值、文字和符号各自编制一个二进制串,这个过程就称为计算机信息编码。根据描述信息的不同可分为:数字编码、字符编码、文字编码(不同国家文字编码不同)。编码常常是以国际标准或国家标准的形式制定和颁布实施的。,2.2 字符信息的表示方法,39,1BCD码(Binary-Coded Decimal Number),2.2 字符信息的表示方法,十进制数与8421BCD编码表,过渡的数据,帮助计算机自动实现二十进制相互转换,40,2ASCII字符编码(American Standard Co
18、de for Information Interchange)ASCII码即美国信息交换标准代码,是目前使用最普遍的字符编码。基本ASCII码的每一个字符使用7位二进制数表示,其中包括了26个英文大写字母、26个英文小写字母、10个数字字符、33个标点符号和33个控制符。为了存储方便,为每个7位ASCII码加上最高位的0后以一个字节(8位)存放,有时最高位也用作奇偶校验位。,2.2 字符信息的表示方法,41,3汉字信息编码用计算机处理汉字时,必须先要对汉字代码化,即对汉字也要进行编码。主要涉及到的编码有:汉字交换码、机内码、外码、字型码和输出码等。(1)汉字交换码(国标码)汉字在不同的计算机上
19、交换汉字信息时的统一编码,称为“汉字交换码”。我国在1980年制定了信息交换用汉字编码字符集基本集,即国标GB2313-80,又称为国标码。国标码规定用两个字节的16位二进制数表示一个汉字,每个字节只使用低7位,两个字节的最高位都置为0。国标码共收集了7445个字符和图形符号,其中包括了一级汉字3755个,二级汉字3008个,共6763个常用汉字。国标码中的字符集按94行、94列排列,其行号称为区号,其列号称为位号,用高字节表示区号,低字节表示位号。“阿”字是排在第16行,第2列的,所以“阿”字的编码为16 02,则称1602为“阿”字的区位码。48 34为“阿”字的国标码。,2.2 字符信息
20、的表示方法,42,(2)汉字内码(机内码)汉字内码是供计算机系统内部存储、加工、传输汉字时统一使用的代码,又称为汉字机内码。把国标GB2312-80中规定的交换码(国标码)的两个字节的最高位分别置为1,从而就得到了汉字内码。“阿”字:48 34为“阿”字的国标码。16进制形式为30 22H 两个字节的最高位都置1就转换为机内码:B0 A2H,2.2 字符信息的表示方法,GB2312编码局部表,GB2312编码总体布局,43,汉字的三要素:音 形 义常用的输入方法有:全拼、双拼、智能ABC、区位码、智能五笔、自然码、郑码等。把这些众多的输入方法按编码方式划分,可分为:数字码 拼音码 拼形码 音形
21、结合码,2.2 字符信息的表示方法,输入码对应每一个汉字机内码没有唯一性,(3)汉字输入码(外码),44,(4)汉字的字形存储码(字形码),2.2 字符信息的表示方法,72,128,288,45,点阵:汉字字形点阵的代码 1616、2424、3232、4848 特点:编码、存储方式简单、无需转换直接输出放大后产生的效果差矢量:存储的是描述汉字字形的轮廓特征 矢量方式特点正好与点阵相反(5)汉字地址码每个汉字字形码在汉字字库中的相对位移地址地址码和机内码要有简明的对应转换关系,2.2 字符信息的表示方法,46,音频信息表示音频(Audio)就是声音的信息表示,通常指在152000Hz的频率范围的
22、声音信号。在计算机中,任何声音都要先对其进行数字化处理,用一系列二进制串组成的数字信号来表示音频信号,使之成为数字化音频。,2.3 多媒体信息表示,47,图形和图像信息表示一般静态图像分为两种:位图(Bitmap)和矢量图(VectorDrawn)。位图:一般是由扫描仪、数字相机、摄像机等输入的画面,人们一般称之为图像。矢量图:一般是指通过绘图软件(如CAD、3dmax等)绘制的图形,由直线、圆、圆孤、任意曲线等组成的画面,这种图形文件中存放的是描述图形的指令,以矢量形式存储的。,2.3 多媒体信息表示,48,多媒体数据压缩技术研究的主要问题包括:数据压缩比、压缩/解压缩速度、简洁的算法。音频压缩音频压缩技术一般分为无损(lossless)压缩及有损(lossy)压缩两大类。,2.4 多媒体信息的压缩技术,图像压缩图像压缩可以分成两种类型:无失真的压缩和有失真的压缩。前者即能够精确地生成原始图像;后者则有某些不太容易引起注意的失真。,