《《文字的编码》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《文字的编码》PPT课件.ppt(13页珍藏版)》请在三一办公上搜索。
1、信息的编码,1.字符编码2.汉字编码,国际标准美国信息交换标准码(American Standard Code for Information Interchange,简称:ASCII码)规定:用7位二进制数来表示一个字符,共可表示27=128种不同字符。,ASCII码表,字符编码,0000000 0000001 0000010 0000011 1111111,ASCII码表,34个控制字符,10个阿拉伯数字,52个大小写英文字母,32个标点符号、运算符号,128个字符,ASCII码,思考:,已知A的ASCII码是1000001,请你推算一下C的ASCII码。字符比较大小,E和P;D和d谁大谁
2、小。字符串比较大小,“boy”和“cat”;“boy”和“but”,谁大谁小。,汉字编码,国家标准 1980年,我国颁布信息交换用汉字编码字符集基本集,即GB2312-80。规定:用两个字节表示一个汉字,该集中共包含汉字6763个,其它符号等682个,共7445个字符。这个字符集是我国中文信息处理技术的发展基础,也是目前国内所有汉字系统的统一标准。,1 2 3 4 94(位),123494(区),115区,1655区,5687区,8894区,第1655区:一级字库,“保”的国标码,b7 b6 b5 b4 b3 b2 b1 b0,“保”的机内码,b7 b6 b5 b4 b3 b2 b1 b0,机
3、内码:为了避免ASCII码和国标码同时使用时产生二义性问题,采用将国标码每个字节的最高位置1,作为汉字机内码。这样既解决了汉字机内码与西文ASCII之间的二义性,又使汉字机内码与国标码具有极简单的对应关系。,汉字编码补充知识,输入存储处理输出,输入码,机内码(唯一),字形码,如:区位码、全拼、双拼、五笔字型、智能ABC例:“保”全拼:bao五笔字形:WKS,二进制数形式,汉字字形的点阵代码(字模码)如:16*16点阵,24*24,32*32,字库中存有每个汉字的点阵代码,输出时检索字库,输出字模点阵得到字形。,”保“:10110001 10100011,例:汉字“你”的输出,输入存储处理输出,智能ABC,ni,机内码,1100010011100011,输入码,字形码,计算机处理汉字的过程,输入 输出,()码,()码,()码,思考:,如果用88点阵来描述汉字“开”的字形,你能将其相应的编码补充完整吗?存储该字形码共需 字节?,0 1 1 1 1 1 1 0,