第2章计算机中信息的表示方法ppt课件.ppt

资源描述

《第2章计算机中信息的表示方法ppt课件.ppt》由会员分享，可在线阅读，更多相关《第2章计算机中信息的表示方法ppt课件.ppt（60页珍藏版）》请在三一办公上搜索。

1、第2章计算机数据表示,计算机要对各种信息或数据进行处理，首先遇到的问题是必须将各种信息以计算机可以识别的方式表示，并且以一定的形式存储在计算机中。现代计算机大都是以二进制表示的数字计算机。数据表示研究的是计算机硬件能够直接识别，可以被指令系统直接调用的数据类型。国际标准化组织（ISO）对数据和信息都进行了专门定义：,第2章计算机中信息的表示方法,何谓数据？“数据是对事实、概念或指令的一种特殊表达形式，这种特殊表达形式可以用人工的方式或自动化装置进行通信、翻译转换或者进行加工处理”。数据的概念要比人们日常生活中理解的“可以比较其大小的数值”广泛的多。数字、文字、符号、图形、图像、声音都包括在

2、数据范畴中。,数据,数值数据,非数值数据,文字、字符,图形、图像,声音,数据类型,无符号数,有符号数,21 数值数据的表示221进位计数制及其相互转换1进位计数制按照一定进位方法进行计数的数制称为进位计数制，简称进制。在日常生活中，人们习惯使用的进制是十进制（Decimal），但在计算机内部采用的进制却是二进制（Binary）。由于用二进制表示的数的位数长，书写不便，为了便于书写常采用八进制（Octal Q）和十六进制（Hexadecimal）作为中间进制。,（1）基数进制是以表示数值可以选用基本数码的个数来命名的，计数制允许选用的基本数码的个数称为基数，用J表示。,（2）权在进位计数制中

3、，同一个数码处在数的不同位置上，它所代表的数值的大小是不同的。每一个数位被赋于J 的数值称为位权，简称权。,（3）进位计数制的按权展开式在进位计数制中，每个数位的数值等于该位数码与该位的权之乘积，各种进位制的数都可以写成按权展开的多项式和的形式，一个以J为基数的数KJ可表示为：KJ=kn-1Jn-1+kn-2Jn-2+k1J1+k0J0+k-1J-1+k-2J-2+k-mJ-m=,KJ-J进制数n-J进制数整数部分的位数m-J进制数小数部分的位数ki-第i位上的数码，也称系数Ji-第i位上的权。,例：十进制数678.34 的按权展开式,二进制、八进制、十六进制数转换成十进制数常用的方法是“按

4、权展开转换法”，具体做法是二进制、八进制、十六进制数按照权展开，然后再按照十进制求和，结果就是所要的十进制数。,2二进制基数为2的计数制叫二进制。二进制只有“0”和“1”两种数码，计数逢二进一。二进制的优点：（1）二进制数和十进制数之间的关系不复杂（2）技术容易实现,（3）二进制运算规则简单,二进制数的加法运算,二进制数的减法运算,加法运算法则0+0=00+1=1+0=11+1=0,减法运算法则0-0=1-1=01-0=10-1=1,二进制数的乘法运算,乘法运算法则00=001=10=011=1,除法运算法则01=011=1,二进制数的除法运算,（4）二进制数中的0、1数码与逻辑代数的两个

5、值“真”和“假”相对应，为计算机实现逻辑运算和程序中逻辑判断提供了便利条件。,1、逻辑或运算：or v+2、逻辑与运算:and 3、逻辑非运算:not,A B F=A+B0 0 00 1 10 11 1 1,A B F=A B0 0 00 1 00 01 1 1,A F=A0 1 1 0,整数部分：除以 J取余数，直到商为0，余数从右到左排列。小数部分：乘以 J取整数，整数从左到右排列。,100(D)=144(Q)=64(H),例 100.345(D)=1100100.01011(B),3进位计数制之间的转换方法（1）十进制数转换成J进制数,十进制实数既有整数部分，又有小数部分，其转换方法是将

6、整数部分和小数部分分别转换，然后将这两部分拼起来即可。,（2）二进制、八进制、十六进制数间的相互转换,1 101 101 110.110 101(B)=1556.65(Q)1 5 5 6 6 511 0110 1111.1101 01(B)=36F.D4(H)3 6 F D 4,一位八进制数对应三位二进制数一位十六进制数对应四位二进制数二进制转化成八(十六)进制整数部分：从右向左按三(四)位进行分组小数部分：从左向右按三(四)位进行分组不足补零,（3）任意进制数转换成十进制数任意进制数转换成十进制数常用的方法是“按权展开转换法”，具体做法是将任意进制数按照权展开，然后再按照十进制求和，结

7、果就是所要的十进制数。,例：二进制数 111010B 转换成十进制数 111010B=125+124+123+022+121+020=32+16+8+0+2+0=58D,212 数值数据的机器码表示1符号数的机器码表示（1）机器数和真值机器数：数在计算机中的二进制表示形式称为机器数。机器数有3个特点：数的符号数值化：通常用“0”表示“+”号，“1”表示“”号，符号放在二进制数的最高位，称为符号位。小数点不占数位。隐含表示机器数的位数受机器设备的限制真值：因为符号在计算机中占据一位，机器数的形式值就不等于真正的数值，为了区别起见，我们把带符号位的机器数所对应的数值称为机器数的真值。,在计算机中有

8、符号数的表示是将符号和数一起进行编码，常用的编码有原码、补码和反码。在这些编码中，通常用一位（一般是最高位）来表示符号，剩余的位数表示数值部分的编码。（2）原码表示法在原码表示法中，最高位为符号位，其余位为数的绝对值。原码的定义(机器字长为n+1，其中一位符号位),小数的原码：,整数的原码：,原码的求法：原码表示直观，与真值的转换方便，只要将真值符号位的“+”用“0”，“”用“1”表示，剩下的位数就是真值的绝对值了。用原码表示的机器数进行乘除运算比较方便，只要将数值部分直接乘除，符号位相异或就可以获得正确的结果。,（2）反码的表示法反码一般用来作为原码求补码或补码求原码的工具，计算机中很少采用

9、反码进行数的运算。反码定义：根据定义，正数的反码和原码相同，负数的反码将符号位用“1”表示，数值位按位取反即可。反码的表示范围与原码的表示范围是一样的。,小数的反码：,整数的反码：,（3）补码表示法设计补码表示的目的是：补码表示的数在进行加减运算时，符号位可以看成数值一起参加运算，只要不溢出（数的大小超过机器数表示的范围称溢出）结果都是正确的，从而简化了加减法运算规则，简化了运算器的设计。,模和同余的概念模：一个计量器的容量或一个计量单位叫做模或模数，记作M。如3位二进制数它的模M=23=8。同余：设a，b两整数被同一正整数M去除而余数相同，则称a、b对M同余。记为a=b（mod M）。如：

10、9/12=（12-3）/12=1+（-3）/12 即9和-3是关于模12是同余的。具有同余关系的两个数具有互补关系，即-3的补码是9。这样求一个负数的补码就将模加上该负数即可12+（-3）=9。,小数的补码：,整数的补码：,补码的定义(机器字长为n+1，其中一位符号位),补码的求法：从补码的定义可以看出，正数的补码和原码相同，都等于真值。负数的补码可以用定义来求，也可以用更直观的方法来求：原码除符号位外按位取反再在最低位加1（符号位用1表示，数字位直接取反再在最低位加1）。例：计算机字长n=8位，机器数真值x=-1011011B，求x的补码。因为n=8，模=28=10000 0000B，x0所

11、以 x补=28-x=10000 0000B-1011011=10100101B注意：补码的零只由一种表示:0补=0补=+0补=0000 0000,2定点数与浮点数在进行算术运算时，需要指出小数点的位置，在计算机中，小数点有两种表示方法：定点表示法和浮点表示法。（1）定点表示法定点表示法约定数据的小数点的位置固定不变，小数的小数点通常放在有效数字的前面符号的后面，整数的小数点就放在有效数字的末尾，这就形成了定点小数和定点整数。无论是整数还是小数，小数点都是以隐含的方式来表示，不占有效的数据位，这样做的目的是字长一定的计算机，数的表示范围最大。,定点整数：,定点小数：,只有定点数据的计算机称为定点

12、计算机。定点计算机只能表示纯小数或整数，所能表示的数的范围有限，尤其是定点小数，数的表示范围小于1，这在实际使用时是很不方便的，现代计算机大多采用浮点表示法。,（2）浮点表示法计算机多数情况下采用浮点数表示数值，它与科学计算法相似，把任意一个二进制数通过移动小数点位置表示成阶码和尾数两部分。在浮点表示法中，E称为浮点数的阶数，用定点整数表示，一般采用补码表示。S称浮点数的尾数，用定点小数表示。尾数的符号表示数的正负。,N=2ES,浮点数表示,110.011(B)=1.100112+10=11001.12-10=0.1100112+11,N=数符尾数2阶符阶码尾数的位数决定数的精度阶码的位数决定

13、数的范围,规格化的形式：尾数的绝对值大于等于0.1并且小于1，从而惟一地规定了小数点的位置。,3.数字编码十进制数在计算机中经常以十进制的二进制编码BCD(Binary Coded Decimal)码来表示的。大多数计算机都有专门的十进制运算指令，可以对十进制数直接进行处理。4位二进制共有16种状态，用4位二进制表示1位十进制，有多余的六个状态，所以有多种表示方法，可以产生多种BCD码。,有权码：十进制数据有权码是指表示每一个十进制数位的四个二进制位（称为基2码）都有一个确定的权。常见的有8421码（也称自然码）、2421码等。无权码：十进制数据无权码是指表示每一个十进制数位的四个二进制位没有

14、一个确定的权。常用的有余3码和格雷码（又称循环码）余3码的编码规则是在8421码的基础上，将每一个代码都加0011而形成。其主要优点是执行加法运算时，能正确产生进位，而且还给减法带来方便。格雷码（又称循环码）其编码规则是任何两个相邻的代码只有一个二进制位不同，其余三位必须相同。这样使得从一个编码变到下一个编码时只有一位发生变化，变码速度最快，有利于得到更好的译码波行，故在D/A和A/D转换电路中得到很好的运行结果。并且用数字逻辑电路实现时不会产生冒险竞争。,22非数值数据的表示字符、汉字、图形、图像、语言以及逻辑数据统称为非数值数据。它们在计算机中也是用“0”“1”码来表示的。,221字符数

15、据字符数据主要指数字、字母、通用符号、控制符号等，在机内它们都被变换成计算机能够识别的二进制编码，这些字符以什么样的规则进行二进制0、1组合，完全是人为规定的。使用最广泛的就是ASCII（American Standard Code For Information Interchange 美国标准信息交换码）码。在这种编码中，每个字符用8个二进制位来存储和发送。第八位一般设置为“0”或用作数据传输时错误检测的奇偶校验位。余下的七位最多可以表示128个不同的字符。,在ASCII码中，数字09的ASCII码（0110000 0111001）的低四位同09的BCD码（00001001）完全一样。与

16、另外一种EBCDIC 码(Extended Binary Coded Decimal Interchange Code)表示的09的低四位（11110000 11111001）也是一样的。由ASCII码可以很方便地获得BCD码，数字的ASCII码=30H+数字的BCD码。,26个英文字母分大、小写，大写字母AZ的ASCII从10000011011010是连续的，小写字母az的ASCII从11000011111010是连续的，且大、小字母的ASCII码只有第6位不同（小写字母这一位是1，大写这一位是0），这使得大、小写字母之间的转换非常方便。小写字母ASCII码=大写字母ASCII码+01000

17、00（20H）。,222逻辑数据逻辑数据有若干位二进制数字组成，每位之间没有权的内在联系，只有逻辑值：“真”和“假”。逻辑数据只能参加逻辑运算，如逻辑与、逻辑或、逻辑非，特点是只进行本位操作。,233汉字的表示方法中文信息的基本组成单位是汉字，汉字也是字符，但汉字是表意文字，一个汉字就是一个方块图形。汉字有以下特点：汉字是一种象形文字，据统计有50000字形各异的汉字，常用汉字有7000左右；汉字字型结构复杂，笔画繁多；汉字重音字多；汉字多音字多。,计算机要对汉字信息进行处理，首先必须将汉字转换成计算机可以接收的“0”“1”组成的编码输入计算机，称为汉字输入码。输入码进入计算机必须转换成汉字内

18、码才能进行信息处理。为了最终显示、打印汉字，内码必须转换成汉字字形码（字模）。为了使不同的汉字处理系统之间能够交换信息，还必须设有汉字交换码。,1汉字输入码计算机是西方国家发明的，而西文只要用很少的键就可以输入所有的信息。要用西文键盘输入汉字，首先必须解决汉字输入问题，这就是汉字输入码要解决的问题。汉字的输入方法很多，常用的主要有以下几种:（1）数字编码特点是没有重码，输入时可以完全实现盲打，难以记忆，不易推广。国际区位码是最常用的数字编码，它是将汉字字符集编成94行（区）94列（位）的表，每个汉字对应表中惟一的位置号，这个号就是区位码。分区号（0194）和位号（0194），区号在前位号在后，

19、用四位数字来表示。0109区：非汉字1687区：汉字1015、8894：空白练习：用区位码输入汉字,（2）字音编码是一种基于汉语拼音的编码方法。主要有微软拼音、全拼、双拼以及智能ABC等。特点是只要会汉语拼音就能输入汉字，不需要再进行复杂的系统训练，是目前绝大部分非专业人员输入汉字的首选输入法。由于汉字同音字多，重码率高，不能做到盲打，速度不如汉字五笔输入法。,（3）字形编码这是根据汉字的字形分类而给出的编码方法。如汉字五笔输入法，特点是输入速度快，需要通过训练才可以达到较快的输入速度，通常只有专业的文字录入人员才使用这种方法。（4）形音编码形音编码是将字音编码和字形编码相结合的一种编码方

20、法。如首尾编码是利用汉字的左上角和右下角的笔形（字形编码法）和汉字的第一个音符所对应的拼音字母（字音编码）的一种编码方法。除了上面的输入法外，还有手写输入法、语言输入法，这些方法比较适合老年人。,2汉字交换码这是在两个汉字处理系统之间进行汉字交换时使用的编码，也称国标码。同一个汉字在不同的计算机系统中可以采用不同的表示方法。但在不同系统之间要交换信息时，必须采用统一标准规范，否则难以进行交换。为此，我国已制定并颁布了国家标准GB2312-80信息交换用汉字编码字符集基本集，简称国标码。,国标码共有字符7445个。该字符集规定了常用汉字6763个（一级汉字：3755个；二级汉字：3008个）。和

21、一些其他字符（俄文字母、日语假名、拉丁字母、希腊字母、汉语拼音和一般图形字符）682个。在交换码中的每个字符用两个字节进行编码，每个字节的低7位表示信息，最高位为零，共有214个编码。,国标码与区位码有简单的对应关系：国标码=区位码+2020H。加2020H的目的是使两个字符都避免与码的控制字符冲突。汉字：中国标码：86 80D(0101 0110 0101 0000)B 5 6 5 0 H区位码：3 6 3 0 H 0011 0110 0011 0000 B 54 48 D,3汉字机内码这是汉字信息处理系统在计算机内部存储和处理汉字信息时使用的编码。不同计算机系统可以使用不同的机内码，但同

22、一计算机系统中汉字机内码应该相同，而且不同计算机之间在交换汉字信息时都必须将汉字机内码转换成标准的交换码（GB3212-80）。汉字系统中机内码在编码时必须考虑到既能与ASCII码严格区分，又能与国标码有简单的对应关系，因此，机内码的编码方案应能在国标码的基础上方便地得到。常用的方案是把国标码的每一个字节的最高位的0变成1，其他各位的信息保持不变。,如“大”的汉字机内码为B4F3H（对应的二进制10110100，11110011B），国标码为3473H（对应的二进制00110100，01110011B）。汉字机内码与国标码和区位码之间的关系为：机内码=国标码+8080H=区位码+A0A0H在一

23、个处理汉字信息系统的计算机内部，区分计算机内部信息是一个ASCII编码的字符还是汉字编码的字符，只要判别连续两个字节的最高位是否为1。若为1，这连续的两个字节构成一个汉字，否则该字节的低7位是一个ASCII编码的字符。汉字：中国标码：86 80D(0101 0110 0101 0000)B 机内码：1101 0110 1101 0000 B,4汉字的字形码计算机中的汉字内码是不能直接在屏幕上显示和打印的，必须把它转换成对应的汉字字形码，一般通过点阵图的形式产生，用1表示黑点，0表示白点。汉字点阵的大小有多种规格，汉字字形质量随点阵数的增加而优化。,1616点阵字形,通常，计算机把所有汉字的字

24、形码集合起来组成汉字库存放在计算机里，当汉字输出时由专门的字形检索程序根据这个汉字的内码从汉字库里检索出对应的字形码，由字形码再控制输出设备输出汉字。汉字点阵字型的汉字库结构简单，但是当需要对汉字进行放大、缩小、平移、倾斜、旋转、投影等变换时，汉字的字形效果不好，若使用矢量汉字库、曲线字库的汉字，字形用直线或曲线表示，则能产生高质量的输出字形。,汉字处理过程：,语音是人发出的一系列气流脉冲激励声带而产生不同频率振动的结果，是一种模拟信号，它是以连续波的形式传播的，不能直接进入计算机存储。语音的计算机表示要经过：第一步，对声音进行采样第二步，量化语音通过拾音设备转换成频率、幅度连续变化的电信号（

25、模拟量），然后通过声卡对模拟量进行采样得到一组离散数据值。然后用专门的模/数（A/D）转换电路转换为数字量。,2.2.4 语音的计算机表示方法,声波采样与数字化,采样频率f：1/T，每秒钟的采样次数；采样点精度：存放采样点振幅值A的二进制位数；声道数：声音通道的个数，立体声为双声道。每秒钟存储声音容量的公式为：采样频率采样精度（位数）声道数/8=字节数,模拟量转换数字量,A/D转换后的数字信号,采样后的离散信号,模拟量输入信号,10010111,由于计算机只能处理数字数据，所以需要把视觉形象转换为由点阵构成，用二进制表示的数字化图像，转化过程包含两个步骤：第一步，抽样第二步，量化,2.2.5

26、位图图像的计算机表示,2.2.6 图形的计算机表示图形,图像采集设备输入图像后，对图像依据某种标准进行分析、分解，提取出具有一定意义的独立的信息单元-图元。用指令描述一个个的图元及各图元之间的联系。于是一幅原始图像以一组有序的指令形式存入计算机。因为图像不是直接用画面的每一个像素点来描述，而是用图元序列描述，图像的这种表示方式称为图形，或称矢量图形。图形是一种抽象化的图像。图形输出显示后与位图图像是一样的，但位图图像的基本元素是象素点，计算机存储的是每个象素点的量化值，占用存储空间大。图形的基本元素是图元，使用图形指令描述图元，实际上图形指令只需要知道图元的几何特征，一般经过数学公式计算得出

27、图元,2.3 校验,计算机从硬件、软件上采取了很多措施提高机器抗干扰能力，一旦出错，要能及时检测并纠正错误。其中一种方法是对数据信息扩充，加入新的代码，它与原数据信息一起按某种规律编码后具有发现错误的能力-校验码,2.3.1 奇偶校验码,将每个数据代码扩展一个二进位作为校验位。奇校验：编码里含“1”的个数连同校验位的取值共有奇数个“1”偶校验：编码里含“1”的个数连同校验位的取值共有偶数个“1”,2.3.2 交叉校验,对数据的横向、纵向同时设置奇偶校验位，这种方法叫交叉校验。交叉校验能检出二位同时出错，但不能确定错误的位置，如果只有一位出错，就能检测出有错，并能确定出错位置。,2.3.3 循

28、环冗余校验码,设M(X)是被校验的n位二进制信息，G(X)是K+1位的二进制数（称为生成多项式），将M(X)左移K位与G(X)相除得K位余数，即位校验位。将校验位放在M(X)后面形成n+k位的CRC码。CRC码的特性：CRC码能被G(X)整除，即余数为0。CRC码的检错方法：在接收数据时，将接收的CRC码与G(X)相除，若余数为0，则表明数据正确;当余数不为0时，说明数据有错。若G(X)选择的好，余数还可以判断出错误的位置，从而可以纠正错误。,设传送信息M(x)有6位：100110B，选择的生成多项式为 x3+x1+x0=1011,计算校验位并写出CRC码。生成多项式是4位=r+1，所以校验位

29、r=3。现做模2除法，注意除时M(x)后加r个0：,1 0 1 0 0 1,1 0 0 1 1 0 0 0 0,1 0 1 1,1 0 1 1,0 1 0 1,0 0 0 0,1 0 1 0,1 0 1 1,0 0 1 0,0 0 0 0,0 1 0 0,0 0 0 0,1 0 0 0,1 0 1 1,0 1 1,校验位,因此，校验位是011，CRC码是100110011,练习：已知 M（X）=1100，生成多项式G（X）=X3+X1+X0=1011，试计算校验位，并写出CRC码。,分析余数和出错位的关系。,常用的生成多项式长13位、17位、33位。如：X12+X11+X3+X2+X1+1X16+X12+X6+X1,

展开阅读全文