《数据在计算机中的表示课件.ppt》由会员分享,可在线阅读,更多相关《数据在计算机中的表示课件.ppt(65页珍藏版)》请在三一办公上搜索。
1、计算机应用基础数据在计算机中的表示,徐艳艳信息学院,数据在计算机中的表示,进位计数制及相互转换数值及字符在计算机中的表示,什么是二进制?二进制表示的数据中,每个数位上的数字只能是0或者1(10101011)2逢2进一:(1)2+(1)2=(10)2,计算机中采用二进制来表示数据,二进制,在计算机中为什么要采用二进制?,容易实现 二进制只有0和1两个状态,电子器件具有实现的可行性运算简单 二进制的运算法则少,运算简单,使硬件结构大大简化有逻辑性 二进制的0和1正好和逻辑代数的假和真相对应有稳定性 二进制只有0和1两个状态,传输和处理时不容易出错,二进制的优点,数据单位,计算机中数据的常用单位有位
2、、字节和字。1、位(Bit)也称比特,记为bit或b。是数据的最小单位,是二进制的一位数,用0或1表示。2、字节(Byte)简称为B。字节是表示存储空间大小的最基本单位。1B=8bit 1KB=1024B=210B 1MB=1024KB=210KB=220B 1GB=1024MB=210MB=230B,数据单位,字:Word或W,字由若干字节组成,每个字中包含的二进制位数称为字长示例:64位计算机是指计算机一次可以处理64位二进制数64位计算机中的64是指机器字长,一个位,一个字节,字长(16位),进位计数制,按进位的原则进行的计数方法称为进位计数制任何一种进位计数值表示的数都可以写成按其权展
3、开的多项式之和(数码*权值)。,在采用进位计数的数字系统中,如果用r个基本符号(例如0,1,2,r-1)表示数值,则称其为基r数制(Radix-r Number System),r称为该数制的基(Radix),数制中每一固定位置对应的单位值称为位权(基r的i次方)。,常用的进位计数制,日常使用:十进制(Decimal)计算机采用:二进制(Binary)为了简化二进制的表示方式,使用八进制(Octal)十六进制(Hexdecimal),二进制的基是2,八进制的基是8 十进制的基是10,十六进制的基是16,不同的数制,它们的共同特点是:1.每一种数制都有固定的符号集:如二进制数制,其有2个符号:0
4、,1;如八进制数制,其有8个符号:0,1,2,,7;如十进制数制,其有10个符号:0,1,2,,9;如十六进制数制,其有16个符号:0,1,2,,9,A,B,C,D,E,F,Why?大家思考一下,十六进制(Hexadecimal)的基数是16,它必须有16个数字才够用。因此,除了十进制中的10个数可用外,还必须再创造6个数字。十六进制中借用了6个英文字母。所以,它的16个数字依次是:09,AF。其中A至F分别代表十进制数的10至15,最大的数字也是基数减1。,由于存在不同的进制,那么在今后在给出了一个数时必须指明它是什么数制的数。例如:(1010)2、(1010)8、(1010)10、(101
5、0)16除了用下标表示外,还可用后缀字母来表示数制。例如,后缀字母B表示二进制,后缀字母O表示八进制后缀字母D表示十进制,后缀字母H表示十六进制,后缀,判断对错,每一个数位上的数字不能超出数码的范围(1010)2,(18)10,(28)8,(6AEI)16,(正确),(正确),(错误),(错误),进位计数制间的转换,非十进制转换为十进制 二进制 八进制 十进制 十六进制十进制转换为非十进制 二进制 八进制 十进制 十六进制 非十进制之间的转换二进制 八进制二进制 十六进制之间,简单,简单,将各位数码乘以各自的权值累加即可。,(1011.101)2=123+022+121+120+12-1+02
6、-2+12-3=8+0+2+1+0.5+0+0.125=(11.625)10,(143.65)8=182+481+380+68-1+58-2=64+32+3+0.75+0.78125=(99.828125)10,(32CF.4B)16=3163+2162+12161+15160+416-1+1116-2=12288+512+192+15+0.25+0.4296875=(13007.19196875)10,非十进制数转换成十进制数,为了将一个即有整数部分又有小数部分的十进制数转换成二进制数,可以将其整数部分和小数部分分别转换,然后再组合。,十进制数转换成非十进制数,对整数部分:除基取余,除基后所
7、得到的第一个余数是转换后进制整数数列的最低位;所得的最后一个余数是转换后的进制整数数列的最高位。对于十进制数转换为非十进制数。这个规律是:“先余为低,后余为高”,十进制数(18)10转换成二进制,即十进制数(18)10=(10010)2,将小数不断乘以基取整数,直到小数部分为0或达到所求的精度为止(小数部分可能永远的不会得到0);第一个得到的整数为最高位,最后得到的为最低位,这个规律是:“先整为高,后整为低”,对小数部分:乘基取整,第一个整数为最高位,最后一个整数为最低位。刚好与整数部分的相反。,注意:,06875 2,1.3750 整数为 1 0.3750 2,0.7500 整数为 0 2,
8、1.5 整数为 10.52,1.0 整数为 1(0.6875)10=(0.1011)2,把(0.6875)10转换为二进制,十进制转换为八进制,八进制数基数为8:对整数部分,除8取余;对小数部分,乘8取整。,例:把207转换为八进制数:(207)10=(317)8,十进制转换为十六进制,十进制数转换为十六进制数的方法同十进制数转换为二进制的方法类似。,举例:(216)10=(?)16,十进制数016和其他进制数之间的对应关系,二进制数转换为八进制数八进制数转换为二进制数二进制数转换为十六进制数十六进制数转换为二进制数,非十进制的数之间的相互转换,方法:将二进制数从最右边的低位到高位每3位组成一
9、组,最后不足3位的前面补0,然后每3位二进制数用一个八进制数来表示即可转换为八进制。:010 101 010 011 2 5 2 3 2=(2523)8,二进制数转换为八进制数,方法:将每一位八进制数用3位二进制数表示即可得到相应的二进制数。例如:将八进制数3274转换为二进制数:3 2 7 4 011 010 111 100 即(3274)82,八进制数转换为二进制数,方法:将二进制数从最右边的低位到高位每4位分成一组,最后不足4位的前面补0,然后每4位二进制用十六进制数来表示即可得到相应的十六进制数。0010 1110 1001 0011 2 E 9 3 即(2=(2E93)16,二进制转
10、换为十六进制,方法:将每一位十六进制数用4位二进制数表示即可得到相应的二进制数。例如:将十六进制数4C3F转换成二进制数:4 C 3 F 0100 1100 0011 1111 即(4C3F)16 2,十六进制转换为二进制,从二进制数很容易地直接写成八进制数和十六进制数。反之亦然。即非十进制数之间的转换较简单。而由十进制数转换成二进制数、八进制数和十六进制数相比较而言要难一些。,数据转换小结,数值及字符在计算机中的表示,数值数据字符图形图像编码,使用计算机的目的是利用计算机进行信息的处理,最终得到所需的处理结果。,信息?,计算机中信息表示形式,计算机的信息转换过程,输入信息,数值西文字符汉字,
11、二进制数,数值西文字符汉字,计算机,输出信息,编码,编码,各类数据在计算机中的转换过程,数值-十/二进制转换(输入)-内存-二/十进制转换(输出)-数值西文-ASCII码(输入)-内存-西文字形码(输出)-西文汉字-输入码/机内码转换(输入)-内存-汉字字形码(输出)-汉字声音、图像-模/数转换(输入)-内存-数/模转换(输出)-声音、图像,数值数据-整数,通常规定一个数的最高位为符号位。用“0”和“1”来表示,表示该数为正,符号位为表示该数为负。一个数在计算机内部的表示称为机器数,符号位,计算机中,常对机器数采用原码、反码与补码表示。使用补码的优点是:(1)使得符号位能与有效数值 部分一起参
12、加运算,从而简化运算规则。(2)使减法运算转换为加法运算,简化计算机中运算器的线路设计。,对于正数,其原码、反码与补码表示是一致的。对于负数,除符号位外,将其原码的数值部分求反(即变,变)则可求其反码,由反码的最低位加即可求得其补码。,假设字长为位。二进制数01010101 的原码、反码与补码表示均为01010101。而二进制数11010101的原码为11010101,其反码表示为10101010,其补码表示为10101011。,原码和补码示例,正整数的补码等于原码负整数的补码:将该数的绝对值按位取反再加1,|-10|,取反,再加1得-10的补码,整数在内存中是以补码的形式存在的,原码和补码示
13、例,占两个字节的整数的数值范围是-3276832767,32767,-32768的补码,数值数据-浮点数,浮点数的规格化表示规格化数=数符*1.xxxxx*2指数,1、若浮点数为正数,则数符为0,否则为12、尾数中的”1.”不存储3、存储的阶码等于规格化数中的指数加上127,即阶码=指数+127,这是为了处理负指数的情况。IEEE754的规定。,例1,26.0格式化表示:26.0=11010.0B=+1.10100*2的4次方B阶码:4+127=131=10000011B因此,26.0在计算机中的存储为:,例2,-2.5格式化表示:-2.5=-10.1B=-1.01*2的1次方B阶码:1+12
14、7=128=10000000B因此,-2.5在计算机中的存储为:,浮点数编码说明,一般来说,增加尾数的位数,将增加可表示区域数据点的密度,从而提高了数据的精度;增加阶码的位数,能增大可表示的数据区域。,由于计算机中的数据以二进制的形式存储、运算、识别和处理。字母和各种字符也必须按特定规则变成二进制编码才能输入计算机。,字符的表示,字符编码(character code):规定用怎样的二进制码来表示字母、数字以及专门符号。在微型机系统中,有一种重要的字符编码方式ASCII码。,字符的表示,ASCII码 是美国标准信息交换码(American Standard Code for informati
15、on Interchange)的缩写。它本来只是一个美国交换码的国家标准,但它成为一种国际标准。采用7位二进制数编码,用来表示128种不同字符。,字符的表示,国际上通用的ASCII码,它包含:10个阿拉伯数字:09,0的ASCII码4852个英文字母:(AZ,az),A的ASCII码65,a的97ASCII码32个标点符号和运算符以及34个控制码。,ASCII编码表,英文是拼音文字,一般不超过128种字符的字符集。而汉字字数多,字形复杂,计算机存储和处理也比较复杂。计算机处理汉字信息的前提条件是对每个汉字进行编码,这些编码统称为汉字编码。汉字信息在系统内传送的过程就是汉字编码转换的过程。,汉字
16、编码,从汉字代码转换的角度,一般可以把汉字信息处理系统抽象为一个结构模型,如下图示:汉字输入 汉字输出 输入码 国标码 机 内码 字形码,汉字编码,输入汉字时使用的编码音码类:全拼、双拼、微软拼音、智能ABC、紫光输入法、搜狗输入法等 形码类:五笔字型法、郑码输入法语音识别输入、手写输入等等,汉字输入码,国标码又称为汉字交换码。1981年我国颁布了信息交换用汉字编码字符集基本集,国家标准代号GB2312-80。根据词频统计的结果,选择出6763 个常用汉字,并为每个汉字分配了标准代码,以供汉字交换信息使用。因此,国标码又称为汉字交换码。每个汉字编码占2个字节,使用每个字节的低7位,最多可编码2
17、的14次方个汉字及符号。,汉字国标码,汉字区位码,将GB 231280的全部字符集组成一个9494的方阵,每一行称为一个“区”,编号为0l94;每一列称为一个“位”,编号为0l94,这样得到GB 231280的区位图,用区位图的位置来表示的汉字编码,称为区位码。区码(8个二进制位)和位码(8个二进制位)组合,形成汉字的区位码。区位码、区码、位码都为十进制数,每个汉字的区位码占两个字节,是计算机内部处理汉字信息时所用的汉字编码。机内码为二进制数,为方便多用十六进制表示。,区位码、国标码(汉字交换码)与机内码三者之间的关系如何?,汉字机内码,汉字机内码、国标码(汉字交换码)和区位码三者之间的关系:
18、区位码(十进制)的两个字节分别转换为十六进制后加20H得到对应的国标码;国标码区位码2020H 机内码是汉字交换码(国标码)两个字节的最高位分别加1,即汉字交换码(国标码)的两个字节分别加80H得到对应的机内码;机内码 国标码8080H区位码(十进制)的两个字节分别转换为十六进制后加A0H得到对应的机内码。机内码=区位码+A0A0H,示例,汉字 区位码 国标码机内码 沪 2706(00111011 00100110 B)10111011 10100110 B 久 3035(00111110 01000011 B)10111110 11000011 B,汉字字形码,汉字字形码用于汉字的显示输出或
19、打印机输出。点阵和矢量表示方式。点阵:16*16,24*24,32*32,48*48等。点阵规模越大,字形越清晰美观,所占存储空间越大。矢量不失真。点阵编码存储简单,无需转换直接输出,放大会失真。矢量和点阵相反。控制面板-字体 查看点阵和矢量字体,图形数字化编码,在计算机中,图形(Graphics)和图像(Images)是两个不同的概念。图形 一般指使用绘画软件绘制出的由直线、曲线等组成的画面,图形文件中存放的是描述图形的指令,以矢量图形文件存储。图像 则是由扫描仪、数码相机等输入的画面,数字化后以点阵(位图)形式存储。,矢量表示法基本原理是用直线逼近曲线,用直线段两端点位置表示直线段。采用这
20、种方法表示图形存储量非常少。矢量图形由矢量定义的直线和曲线组成,矢量图形根据轮廓的几何特性进行描述。图形的轮廓画出后,被放在特定位置并填充颜色,移动,缩放或更改颜色不会降低图形的品质。矢量图形与分辨率无关,可以将它缩放到任意大小和以任意分辨率在输出设备上打印出来,都不会影响清晰度。,点阵表示法一幅画可以看作由排列成若干行、若干列的黑白或彩色的光点组成。每一个光点叫做一个像素(pixels),从而形成一个像素点阵列。点阵的像素总数决定了图像的精细程度。像素的数目越多,图像越清晰,其细节的分辨率程度也越高。但同时也必然要占用更大的存储空间。对图像的点阵表示,其行列数的乘积称为图像的分辨率。,图像的
21、点阵表示法的缺点是:保存一幅图像所需的存储空间很大。例如,一个图像的阵列共有480行,每行640个点,则该图像的分辨率为480640像素。后来又发展出了许多压缩图像文件格式来节省存储空间,常用的有:BMP、JPEG、GIF、AVI、MPEG等格式。,将每个像素用若干个二进制位进行编码,表示图像颜色的过程叫做图像数字化。描述图像的重要属性是图像分辨率和颜色深度。图像数字化编码可以分为以下几种(1)黑白色(2)256灰色(3)真彩色图像显示,图像数字化,(1)黑白色如果一个像素点只有黑白两种颜色,那么只用一个二进制位就可以表示一个像素。一个480640的像素点阵需要 480640/8=38400B=37.5KB,(2)256灰色一个像素的灰度就是一个像素的亮度,即介于纯黑和纯白之间的各种情况。计算机中采用分级方式表示灰度。例如分成了256个不同的灰色级别(可以用0到255的数表示),用8个二进制位就能表示一个像素的灰度。采用灰度方式,需要更大的存储容量。例如表示一幅480640像素要大约300KB,(3)真彩色图像显示由于任何颜色的光都可以由RGB(红,绿,蓝)三种基色通过不同强度混合而成。所谓真彩色的图像显示,就是用三个字节表示一个像素点的色彩,其中每个字节表示一种基色的强度,强度被分成256个级别。要表示一幅像素为480640的真彩色点阵图像需要大约1MB,Thanks!,